Cùng với sự hồi phục của nền kinh tế sau covid, các sản phẩm công nghệ thông tin vẫn đang là một trong những lĩnh vực mũi nhọn được quan tâm, chú trọng và được coi là một trong những đầu tàu nhằm hồi phục, phát triển nền kinh tế ở Việt Nam nói riêng và trên toàn thế giới nói chung. Nhân dịp đầu năm học mới, và cùng với sự bùng nổ của các start up về IT, nhóm truyền thông Khoa Công nghệ thông tin đã có dịp trò chuyện với TS. Nguyễn Thế Lộc, giảng viên của Khoa về sản phẩm Origin-STT, giải nhất Nhân tài Đất Việt.
Tiếng Việt được coi là một ngôn ngữ khó học với người nước ngoài bởi ngữ pháp, thanh điệu và đặc trưng vùng miền. Máy tính cũng giống như người nước ngoài - để nó nghe hiểu và diễn giải được giọng nói tiếng Việt thành dạng văn bản không phải là việc dễ dàng. TS. Nguyễn Thế Lộc, giảng viên Khoa Công nghệ thông tin với vai trò Giám đốc phần mềm công ty VAIS cùng với nhóm nghiên cứu đã giải quyết được bài toán hóc búa này và đã gặt hái được thành công.
TS. Nguyễn Thế Lộc cho biết, phần mềm này có thể nhận dạng được giọng nói của cả ba miền Bắc Trung Nam, từ đó chuyển đổi thành chữ viết với độ chính xác cao. Giọng miền Bắc có thể được nhận dạng với độ chính xác lên đến 99%, miền Trung từ 85-90%, miền Nam là 90%. Tốc độ nhận dạng là 0,5 giây, gần như một tốc độ tức thời.
Phần mềm vừa được chạy thử nghiệm tại một số phiên chất vấn trong kỳ họp Quốc hội vừa qua. Trước đây, khi không có phần mềm, Chủ tịch Quốc hội sẽ dùng giấy bút ghi chú đại biểu nào nêu câu hỏi chất vấn gì, Bộ trưởng nào trả lời, nội dung khái quát ra sao. Khi áp dụng phần mềm, tất cả các câu hỏi và phần trả lời, cũng như tên đại biểu được hiển thị ngay trên chiếc máy tính bảng đặt phía trước Chủ tịch Quốc hội Nguyễn Thị Kim Ngân, giúp bà dễ dàng theo dõi mà không cần giấy bút ghi chú. Thông thường mỗi phiên chất vấn, Ban thư ký gồm khoảng 30 người sẽ phải gõ lại nội dung cuộc họp, và nếu cuộc họp buổi sáng thì phải đến chiều mới có phần nội dung gõ lại bằng chữ. Nhưng khi áp dụng phần mềm của VAIS, chỉ khoảng 60 phút sau là toàn bộ nội dung phiên họp đã được ghi lại thành 1 file văn bản. Phần mềm này còn có thể tự viết hoa tên người, tên địa danh, viết đúng định dạng ngày tháng. Thậm chí một số tên riêng tiếng Anh đọc theo kiểu tiếng Việt như Viettel, VinGroup, VinaMilk... phần mềm cũng có thể nhận diện và viết đúng. Ngay cả các dấu chấm, phẩy, phần mềm cũng có thể tự đánh dấu một cách tương đối chính xác.


TS. Nguyễn Thế Lộc với sản phẩm Origin - STT, Giải nhất Nhân tài Đất Việt 2019
Theo TS. Nguyễn Thế Lộc, khoảng cách tối đa từ nguồn phát âm thanh đến nguồn thu âm thanh để phần mềm có thể “nghe hiểu” một cách tốt nhất là 6 mét. Đặc biệt, nó có thể nhận diện được tiếng nói của con người khi âm thanh nền là tiếng nhạc.
Có thể nói tính năng chuyển đổi tiếng nói thành văn bản theo thời gian thực khi ứng dụng trong những cuộc họp kéo dài cả ngày thực sự rất hữu ích. Trong cuộc thi VLSP (Vietnamese Language and Speech Processing), phần mềm đã vượt qua các đối thủ sừng sỏ của FPT, Viettel để giành giải Nhất. Phần mềm này cũng đạt giải thưởng Chuyển đổi Số Việt Nam 2019 do Hội Truyền thông Số Việt Nam phối hợp với VTV24 tổ chức.
Hiện tại, sản phẩm Origin - STT đã được triển khai tại hệ thống máy chủ của một số Bộ, ngành và địa phương như Văn phòng Quốc hội, Bộ Thông tin & Truyền thông, Bộ Tài nguyên và Môi trường, các tỉnh Sóc Trăng, Hà Giang, Ninh Bình, TP.HCM, Hà Nội, và sẽ tiếp tục được sử dụng rộng rãi trên cả nước.
TS. Nguyễn Thế Lộc với niềm say mê nghiên cứu của một người giảng viên công nghệ thông tin, mong muốn sẽ khám phá, phát triển và đóng gói nhiều sản phẩm đa dạng dựa trên công nghệ, đưa sản phẩm đến với hàng triệu người Việt, và không những chỉ ở Việt Nam, mà trên toàn thế giới.
Links Demo sản phẩm:
Demo Gỡ băng từ file âm thanh
Demo Gỡ băng trực tiếp