Ngôn điệu chính là cái mang lại cho tiếng nói con người những âm sắc riêng biệt. Ngôn điệu của lời nói liên kết chặt chẽ với ngữ điệu. Ngữ điệu là sự nâng cao hạ thấp của giọng nói trong câu. Tiếng Việt ta là một ngôn ngữ khá phức tạp bao gồm cả ngôn điệu và ngữ điệu. Do đó vấn đề nghiên cứu các phương pháp nhận dạng tiếng nói đã và đang thu hút rất nhiều sự đầu tưvà nghiên cứu của nhà khoa học.Tuy nhiên cho đến nay kết quả mang lạivẫn chưa hoàn thiện do tính chất quá phức tạp và không cố định củađối tượng nhận dạng là tiếng nói con người, đặc biệt là tiếng Việt.
Hiện nay có rất nhiều phương pháp nhận dạng tiếng nói. Mô hình Fujisaki được ứng dụng rộng rãi trong hệ thống của tiếng Nhật, mô hình MFGI (Mixdorff Fujisaki model of German Intonation) được ứng dụng trong tiếng Đức, mô hình HMM (hidden markov models)…
Trong các mô hình ấy lại áp dụng nhiều phương pháp nhận dạng khác nhau.Mọi phương pháp mang một tính đặc trưng và ưu điểm riêng. • Phương pháp LPC (linear predictive coding)-mã hóa dự báo tuyến tính: nhược điểm là có một số từ phát âm gần giống nhauthì bị nhầm lẫn nhiều.
• Phương pháp AMDF (average magnitudedifference function)- hàm hiệu biên độ trung bình:ưu điểm là số ngõ vào ít,kích thước mạng huấn luyện nhỏ, ít phụ thuộc vào cách phát âm nên tỉ lệ đọc sai ít hơn phương pháp LPC, tuy nhiên khuyết điểm là không phân biệt về thanh điệu, khó sử ụng
trong trường hợp từ đọc liên tiếp.
• AMDF & LPC :Do ưu và nhược điểmcủa hai phương pháp LPC và AMDF nên cần sự kết hợp giữa hai phương pháp đó.
• Phương pháp thứ tư MFCC (mel-frequency ceptrums coefficients).
Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ hay là các âm vị. Nếu các mẫu nàylà bất biến và không thay đổi thì công việc nhận dạng tiếng nóitrở nên đơn giản bằng cách so sánh dữ liệu tiếng nói cần nhận dạng với các mẫu đã được học và lưu trữ trong bộ nhớ.
Nhận dạng tiếng nói là một lĩnh vực tuy không mới nhưng vô cùng phức tạp. Nhận dạng tiếng nói được thế giới bắt đầu nghiên cứu cách đây hơn 50 năm, tuy nhiên những kết quả thực tế đạt được vô cùng khiêm tốn.Còn phải rất lâu nữa con người mới đạt đến việc xây dựng một hệ thống hiểu được tiếng nói như con người. Trong phạm vi chỉ là một đồ án môn học,phần này em sẽ xây dựng chương trình nhận dạng mười chữ số tiếng Việt bằng những công cụ có sẵn của Matlab. Định hướng xây dựng chương trình nhận dạng được tất cả cáctừ, câu trong tiếng việt để có thể ứng dụng được vào thực tế. Tuy nhiên do chỉ mới tiếp xúc ở lĩnh vực này nên khả năng, kiến thức của em còn rất hạn chế, cộng vào đó là những khó khăn về thời gian, phương tiện…nên em chỉ có thể xây dựng một hệ thống nhận dạng nhỏ. Trong tương lai nếu có điều kiện tiếp xúc và nghiên cứusâu hơn về lĩnh vực này, em mong muốn phát triển đồ án này lênđể có thể ứng dụng trong thực tế.

MỤC LỤC
CHƯƠNG 1: LÝ THUYẾT ÂM THANH VÀ TIẾNG NÓI
Bookmark not defined.
1.1 Nguồn gốc âm thanh:
1.2 Các đại lượng đặctrưng cho âm thanh:
1.4 Cơ chế tạo lập tiếng nói của con người:
1.5 Mô hình lọc nguồn tạo tiếng nói: ..
1.6 Hệ thống nghecủa người:
1.7 Quá trình sản xuất tiếng nói và thu nhận tiếng nói của con người:
Bookmark not defined.
1.8.1 Nguyên âm:
1.8.2 Các âm vị khác:
CHƯƠNG 2: LÝ THUYẾT NHẬN DẠNG TIẾNG NÓI:
Bookmark not defined.
2.1 Tổng quan về nhận dạng tiếng nói
2.2 Các nguyên tắc cơ bản trong nhận dạng tiếng nói ......... Error! Bookmark not
defined.
2.4.1 Phân tích các đặc trưng (tham số) tiếng nói
defined.
2.4.3 Xử lý ngôn ngữ:
2.5 Các tiếp cận nhận dạng tiếng nói .................... Error! Bookmark not defined.
2.5.1 Tiếp cận âm thanh-ngữ âm ........................ Error! Bookmark not defined.
2.5.2 Tiếp cận nhận dạng mẫu ........................... Error! Bookmark not defined.
2.5.3 Tiếp cận trí tuệ nhân tạo:.......................... Error! Bookmark not defined.
2.6 Các phương pháp nhận dạng tiếng nói ............ Error! Bookmark not defined.
2.6.1 Mô hình Fujisaki: ....................................... Error! Bookmark not defined.
2.6.2 Mô hình Markvo ẩn ................................... Error! Bookmark not defined.
2.6.3 Mô hình mạng neuron: ............................... Error! Bookmark not defined.
CHƯƠNG 3 : TÍN HIỆU THỜI GIAN LIÊN TỤC:……………...…….…..Error!
Bookmark not defined.
3.1 Quá trình lấy mẫu tín hiệu :………………………………………………………Error! Bookmark not
defined.
3.2 Các sơ đồ lấy mẫu : .......................................... Error! Bookmark not defined.
3.3 Lấy mẫu một tínhiệu hình sin : ....................... Error! Bookmark not defined.
3.4.1 Hiện tượng chống phổ trong lĩnh vực thời gian : ...... Error! Bookmark not
defined.
3.4.2 Hiện tượng chồng phổ trong lĩnh vựctần số: ............ Error! Bookmark not
defined.
3.5 Chuyển đổi A/D và D/A : ................................. Error! Bookmark not defined.
3.5.2 Bộ chuyển đổi A/D sigma-delta lấy mẫu quá : ........ Error! Bookmark not
defined.
3.5.3 Điều chế sigma-delta đa bit: ...................... Error! Bookmark not defined.
3.6 Chuyển đổi D/A lấy mẫu quá : ........................ Error! Bookmark not defined.
3.7 thiết kế các mạch lọc số IIR: ........................... Error! Bookmark not defined.
3.7.1 Tổng quan các kỹ thuật thiết kế mạch lọc số: .......... Error! Bookmark not
defined.
3.7.2 Một số qui định đối với mạch lọc tương tự : ............. Error! Bookmark not
defined.
3.8 Thiết kế mạch lọc số bằng sự bất biến xung: .. Error! Bookmark not defined.
3.9 Thiết kế mạch lọc số từ mạch lọc Butterworth thông thấp: . Error! Bookmark
not defined.
3.9.1 Các đặc trưng của mạch lọcButterworth thông thấp tương tự: ..... Error!
Bookmark not defined.
3.9.2 Thiết kế mạch lọc tương tự Butterworth thông thấp: Error! Bookmark not
defined.
CHƯƠNG 4: MẠNG NEURON:.……………………………………………...Error! Bookmark
not defined.
4.1 Định nghĩa mạng neuron: ................................. Error! Bookmark not defined.
4.2 Kiến trúc mạng neuron: ................................... Error! Bookmark not defined.
4.2.1 Perceptron mộthay nhiều lớp: .................. Error! Bookmark not defined.
4.3 Đặc trưng củamạng neuron: ............................ Error! Bookmark not defined.
4.3.1 Tính chất phi tuyến: ................................... Error! Bookmark not defined.
4.3.2 Tính chất tương ứng đầu vào – đầu ra: ...... Error! Bookmark not defined.
4.3.3 Tính chất thích nghi: .................................. Error! Bookmark not defined.
4.3.4 Tính chất đưa ra lờigiải có bằng chứng: ... Error! Bookmark not defined.
4.3.5 Tính chất chấp nhận sai sót: ...................... Error! Bookmark not defined.
4.3.6 Tính chất đồng dạng trong phân tích và thiết kế: ..... Error! Bookmark not
defined.
CHƯƠNG 5: GIỚI THIỆU HÀM VÀ TOOBOX TRONG MATLAB CẦN ĐỂ
XÂY DỰNG HỆ THỐNG NHẬN DẠNG TIẾNG NÓI BẰNG MẠNG
NEURON:...…………………………………………………………………………..Error! Bookmark not defined.
VoiceBox toolbox ................................................... Error! Bookmark not defined.
NetLab toolbox ....................................................... Error! Bookmark not defined.
CHƯƠNG 6: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG NHẬN DẠNG
TIẾNG NÓI BẰNG MẠNG NEURON
MLP:……………………………………………………………….…………………Error! Bookmark not defined.
6.1 Các bước xây dựng .......................................... Error! Bookmark not defined.
6.2 Chương trình nhận dạng phát âm mười chữ số tiếng Việt:……………………Error!
Bookmark not defined.
KẾT LUẬN:…………...…………………………………………………………..…Error! Bookmark not
defined.
PHỤ LỤC:…………...…………………………………………………………...…..Error! Bookmark not
defined.
TÀI LIỆU THAM
KHẢO:.........................................................................................74


LINK DOWNLOAD


Facebook Google twitter
Từ khóa:
Cùng Chuyên Mục
Blogger Comments
Facebook Comments

Tin Tức Online
Xem Thêm Tất Cả »
Góc Chia Sẻ
Xem Thêm Tất Cả »
Game - Ứng Dụng Hay Tháng 8
Xem Thêm Tất Cả »
Góc Thư Giản
Xem Thêm Tất Cả »
Bài Viết Ngẫu Nhiên
Copyright © 2016 - All Rights Reserved
Template by Bùi Đạt - Powered by Blogger | SiteMap