Wave To Text 5.26

Tải về

3,5 (4) United Research Labs Dùng thử 18.338 Dung lượng: 23,8 MB Ngày: Yêu cầu: Windows NT/95/98/Me/2000/XP

Wave To Text là chương trình có khả năng nhận dạng giọng đọc tiếng anh từ file *.WAV rồi chuyển thành file text .Với kết quả thu được , bạn có thể tự đánh giá về trình độ nghe của mình hoặc dùng nó làm tư liệu.

Khi kích hoạt, bạn sẽ thấy Wav to Text có 4 chức năng là Train voice, Wave to text và Edit conversion. Hai chức năng chủ lực của chương trình :

1. Wave to text :
Trong giao diện tương tác bạn nhấn nút Add và chỉ định 1 hay nhiều file *.WAV đã lưu trên máy theo đúng chuẩn quy định “22.050 Hz 16 – bit Mono”. Trường hợp file âm thanh muốn xử lý thuộc định dạng khác (MP3, WMA...) hay cũng là định dạng WAV nhưng khác chuẩn, bạn hãy dùng các chương trình như : Cool Edit Pro, MP3 WMA WAV Converter... để chuyển định dạng.
Kế tiếp bạn độ chính xác (Accuracy) và tốc độ xử lý (Speed) cho phù hợp với cấu hình máy. Sau cùng, bạn nhấn nút Open files để chương trình bắt đầu xử lý.
Trong quá trình xử lý, bạn có thể thấy các từ được nhận dạng thông qua cửa sổ chính. Khi hoàn tất, sẽ có thông báo : “Success! All waves was converted successfully”, và bạn nhấn OK để kết thúc.

2. Edit conversion :
Đảm bảo rằng file âm thanh đã được xử lý thành công. Bạn nhấn nút Open > Tìm chọn file *.WAV vừa xử lý. Lập tức toàn bộ nội dung sẽ trưng ra trước mắt bạn. Nếu có từ nào bạn thấy chương trình nhận dạng không đúng, hãy chọn từ đó và nhấn nút Start Edit để mở hộp thoại Edit words. Tại đây, bạn có thể thay thế bằng một từ khác trong danh sách sẵn có hoặc nghe lại từ đã chọn (hay từ đoạn văn bản tính từ được chọn trở đi). Khi đã ưng ý bạn chọn toàn bộ văn bản > nhấn nút Copy để đưa nội dung vào bộ nhớ đệm và dán vào ứng dụng khác (hay nhấn nút Save as text để lưu thành file text).

3. Chú ý :
- Qua kiểm nghiệm thực tế, độ chính xác thu được nằm trong khoảng từ 85% đến 90% (vì còn phụ thuộc vào chất lượng âm thanh). Ngoài ra, nếu muốn chương trình nhận dạng tốt về nội dung chuyên ngành y khoa, luật, báo chí thì phải mua thêm các Add-on hỗ trợ.
- Có thể xảy ra tình trạng treo máy nếu bạn chọn Accuracy và Speed ở mức quá cao so với cấu hình máy.
- Nếu file âm thanh là ngôn ngữ khác ngoài tiếng Anh và bạn đã có CSDL (Vocabulary) chứa trong file text, hãy đánh dấu chọn mục User Custom Vocabulary Files tại trường Settings trong cửa sổ Wav to text và nhấn nút dấu 3 chấm để chỉ định.
- Những thông tin, thiết lập liên quan đến chương trình đều được lưu trong file “Amengpc.spk” tại thư mục Program Files\Common Files\Microsoft Shared\Speech Engines\MSCSR.

Tổng hợp

Câu hỏi thường gặp

Wave To Text là chương trình có khả năng nhận dạng giọng đọc tiếng Anh từ file *.WAV rồi chuyển thành file text. Chương trình có 4 chức năng chính: Train voice, Wave to text, Edit conversion, trong đó hai chức năng chủ lực là Wave to text để chuyển đổi file âm thanh thành văn bản, và Edit conversion để chỉnh sửa kết quả chuyển đổi.

Trong giao diện tương tác, bạn nhấn nút Add và chọn 1 hoặc nhiều file *.WAV theo chuẩn 22.050 Hz 16-bit Mono. Nếu file âm thanh không đúng định dạng, bạn cần chuyển đổi bằng các công cụ như Cool Edit Pro hay MP3 WMA WAV Converter. Sau đó, điều chỉnh độ chính xác (Accuracy) và tốc độ xử lý (Speed) phù hợp với cấu hình máy rồi nhấn Open files để chương trình bắt đầu xử lý.

Edit Conversion dùng để chỉnh sửa lại kết quả nhận dạng văn bản từ file âm thanh đã được xử lý. Bạn mở file *.WAV đã xử lý, kiểm tra các từ nhận dạng, nếu phát hiện sai sót có thể chọn từ đó và nhấn Start Edit để thay thế bằng từ đúng trong danh sách hoặc nghe lại từ đó.

Qua kiểm nghiệm thực tế, độ chính xác nhận dạng của chương trình nằm trong khoảng từ 85% đến 90%, tùy thuộc vào chất lượng âm thanh.

Một số lưu ý gồm: Nếu chọn độ chính xác và tốc độ xử lý quá cao so với cấu hình máy, có thể gây treo máy. Để nhận dạng tốt nội dung chuyên ngành như y khoa, luật, báo chí, người dùng cần mua thêm các Add-on hỗ trợ. Nếu file âm thanh là ngôn ngữ khác ngoài tiếng Anh và đã có cơ sở dữ liệu từ vựng (Vocabulary), bạn có thể chọn User Custom Vocabulary Files trong phần Settings để chỉ định.

Tất cả các thông tin và thiết lập liên quan đến chương trình được lưu trong file 'Amengpc.spk' tại thư mục Program Files\Common Files\Microsoft Shared\Speech Engines\MSCSR.

3,5 Mời bạn đánh giá!
  • Phát hành:
  • Sử dụng: Dùng thử
  • Dung lượng: 23,8 MB
  • Lượt xem: 17.813
  • Lượt tải: 18.338
  • Ngày:
  • Yêu cầu: Windows NT/95/98/Me/2000/XP
Liên kết tải về
Link Download chính thức:

Có thể bạn quan tâm