Công nghệ "iNghe"
Quản trị công nghệ - Ngày đăng : 01:04, 08/11/2012
![]() |
iNghe được hiểu nôm na là "mình nói, phần mềm nghe; phần mềm nói, mình nghe". Đó cũng là ý tưởng để một nhóm kỹ sư trẻ (Trần Minh Trường, Lê Hà Minh, Phạm Minh Nhựt, Lê Nguyễn Tường Nhi, Nguyễn Ngọc Huệ) thuộc Phòng Thí nghiệm AlLab, Đại học Khoa học Tự nhiên TP.HCM sáng tạo ra một phần mềm đọc báo tiếng Việt dễ dàng cho cả người bình thường lẫn người khiếm thị.
![]() |
iNghe được hiểu nôm na là "mình nói, phần mềm nghe; phần mềm nói, mình nghe". Đó cũng là ý tưởng để một nhóm kỹ sư trẻ (Trần Minh Trường, Lê Hà Minh, Phạm Minh Nhựt, Lê Nguyễn Tường Nhi, Nguyễn Ngọc Huệ) thuộc Phòng Thí nghiệm AlLab, Đại học Khoa học Tự nhiên TP.HCM sáng tạo ra một phần mềm đọc báo tiếng Việt dễ dàng cho cả người bình thường lẫn người khiếm thị.
Đặc biệt, khi ứng dụng phần mềm này, người sử dụng có thể ra lệnh cho thiết bị bằng giọng nói. Sau hai tháng kể từ khi bắt tay vào nghiên cứu, iNghe phiên bản 1.1 đã ra đời và thử nghiệm thành công. Kết quả càng ý nghĩa hơn khi nhóm đưa được iNghe lên Apple Store, Play Store cho người dùng sử dụng miễn phí trên các thiết bị sử dụng hệ điều hành iOS và Android.
Phần mềm iNghe có thể đọc được 9 tờ báo (Tuổi Trẻ, Thanh Niên, Tiền Phong, Hà Nội Mới, Vietnamnet, VnExpress, Dân Trí, Lao Động, Người Lao Động) và 13 chuyên mục. Người dùng chỉ cần ra lệnh bằng giọng nói, phần mềm sẽ nhận biết và tương tác chọn ra các tờ báo và nội dung theo yêu cầu.
Ví dụ, cần đọc mục Khởi nghiệp của Báo Doanh Nhân Sài Gòn, người đọc chỉ cần dùng câu lệnh: "Báo Doanh Nhân Sài Gòn, tôi muốn đọc mục Khởi nghiệp" là phần mềm sẽ tự động đọc.
Trần Minh Trường, một thành viên trong nhóm nghiên cứu, cho biết: "Phần mềm ban đầu được tích hợp giọng nói của người ở Hà Nội, Huế và TP.HCM, nhưng trong thời gian tới sẽ tích hợp thêm giọng nói của người ở các vùng, miền khác. Bên cạnh đó, với chức năng tương tác qua giọng nói, iNghe sẽ giúp người khiếm thị tiếp cận thông tin trên báo chí thuận tiện.
Người khiếm thị chỉ cần nhấn vào nút "Home" trên thiết bị di động và nói nội dung muốn nghe. Ngoài chức năng chính là đọc báo tiếng Việt, iNghe còn có chức năng đọc văn bản giúp kiều bào hoặc người nước ngoài sử dụng học tiếng Việt hiệu quả”.
Phần mềm gồm 4 module: module tổng hợp tiếng nói, module tổng hợp tin tức (có nhiệm vụ cứ sau một tiếng đồng hồ lại tự động cập nhật tin từ các báo điện tử), module xử lý (có chức năng xử lý ngôn ngữ lập trình sang ngôn ngữ âm thanh) và module phát tiếng nói (nhận tiếng nói của người yêu cầu và chuyển sang ngôn ngữ lập trình, sau đó sẽ phát nội dung chuyên mục của tờ báo).
Khâu xử lý giọng nói là phần khó nhất nhóm kỹ sư phải đương đầu, vì Việt Nam có nhiều giọng địa phương khác nhau nên việc nhận biết cũng khó.
Để lấy "chuẩn", nhóm chọn nền tảng dự án "Tiếng nói phương Nam - VOS" đoạt giải ba cuộc thi "Nhân tài đất Việt 2011". Để có được phần tổng hợp tiếng nói, nhóm đã xây dựng kho dữ liệu huấn luyện mẫu câu "phủ sóng" toàn bộ ký tự tiếng Việt. Đồng thời, nhóm hợp tác với phát thanh viên Kim Phượng của Đài Tiếng nói TP.HCM - VOH để thu âm các mẫu câu.
Bên cạnh đó, iNghe còn có một số tính năng khác: tạo Playlist giúp người dùng lưu lại những tờ báo, chuyên mục yêu thích; đọc SMS giúp người sử dụng vừa nghe báo, vừa nghe nội dung tin nhắn điện thoại nhận được; đặc biệt, với tính năng chia sẻ, người dùng có thể đăng lên Facebook hoặc gửi email nội dung bài viết.
Tuy phần mềm còn một số hạn chế, như chạy chậm, chưa hiểu được các từ viết tắt, nhưng với nhiều tính năng nổi bật, iNghe có thể giúp những người bận rộn tiết kiệm thời gian cập nhật tin tức, giúp người khiếm thị có cơ hội đọc các tờ báo thích. Quan trọng hơn, phần mềm này góp phần nhỏ bé vào việc đưa các sản phẩm công nghệ thông tin Việt Nam ra thị trường quốc tế và có thể bán được.