Apple vừa giới thiệu AI chuyển đổi giọng nói (transcription) mới trên iOS 26 và macOS Tahoe, vượt qua OpenAI Whisper cả về tốc độ lẫn hiệu quả. Công nghệ chuyển lời nói này hiện dành cho các nhà phát triển qua bản beta.
Apple nâng tầm công nghệ chuyển đổi giọng nói bằng AI
Theo MacStories, Apple đang thử nghiệm nhiều cải tiến AI cho iOS 26 và macOS Tahoe. Nổi bật là giải pháp chuyển đổi lời nói sang văn bản với hiệu suất vượt trội so với các đối thủ.
Trải nghiệm thực tế và so sánh tốc độ
- Ứng dụng mẫu Yap dùng Speech API mới, xử lý file video 34 phút/7GB chỉ trong 45 giây
- Kết quả so với các mô hình khác:
- Yap: 45 giây
- MacWhisper (Large V3 Turbo): 1 phút 41 giây
- VidCap: 1 phút 55 giây
- MacWhisper (Large V2): 3 phút 55 giây - Chất lượng transcript TXT, SRT đạt ngang các mô hình khác
- Apple AI nhanh hơn ~55% so với mô hình nhanh nhất của OpenAI Whisper
Các tính năng bổ sung và phạm vi sử dụng
Bên cạnh API chuyển lời thoại, Apple còn phát triển chatbot tích hợp trong Shortcuts, cho phép người dùng truy cập AI trực tiếp và riêng tư.
Hiện tại, các tính năng AI này mới hỗ trợ lập trình viên ở bản beta iOS 26, macOS Tahoe và Xcode 26. Các ứng dụng bên thứ ba sẽ tận dụng API mới khi hai hệ điều hành chính thức phát hành.
Tác động đến hệ sinh thái ứng dụng chuyển đổi giọng nói
Thị trường ứng dụng chuẩn bị đón nhiều thay đổi
Các mô hình AI mới này miễn phí cho lập trình viên, mở ra cơ hội phát triển ứng dụng chuyển giọng nói trên thiết bị Apple tốt hơn, nhanh hơn và không tốn phí bản quyền nền tảng khác.
AI chuyển lời thoại của Apple trên iOS 26 và macOS Tahoe nổi bật với tốc độ xử lý cao, chất lượng tối ưu và lợi thế mở rộng cho lập trình viên. Sự cải tiến này hứa hẹn giúp hệ sinh thái Apple ngày càng mạnh ở lĩnh vực tự động hóa chuyển đổi giọng nói.
