Google DeepMind vừa công bố Aeneas, mô hình AI mã nguồn mở giúp phục hồi và xác định bối cảnh văn bản Latin cổ tiêu biến hoặc bị hư hỏng. Công cụ này giúp sử học gia làm việc nhanh hơn, hiệu quả hơn nhờ khả năng phân tích hàng nghìn bản khắc chỉ trong vài giây.
Aeneas: AI phục hồi văn bản Latin cổ của DeepMind
DeepMind, đơn vị thuộc Google, đã ra mắt mô hình AI mang tên Aeneas giúp phục hồi các bản khắc Latin bị rời rạc hoặc hư tổn. Công cụ này miễn phí, mã nguồn mở và đã sẵn sàng cho các nhà nghiên cứu tại website 'Predicting the Past'.
Khả năng chính của Aeneas
- Phục hồi văn bản thiếu hụt: Aeneas có thể điền các đoạn văn bản bị mất, không giới hạn độ dài, tương tự việc giải ô chữ với số ký tự không xác định.
- Tìm các đoạn song song (parallels): Mô hình xác định các văn bản tương tự dựa vào từ ngữ, cấu trúc câu hoặc vị trí địa lý để đặt bản khắc vào đúng bối cảnh lịch sử.
- Phân tích đa phương thức (multimodal): Aeneas không chỉ xử lý chữ viết mà còn có thể phân tích hình ảnh liên quan tới văn bản.
Vai trò trong nghiên cứu lịch sử
Aeneas hỗ trợ các sử gia nhanh chóng tìm dữ liệu tương đồng và giải mã ý nghĩa của bản khắc. DeepMind cho biết, mỗi văn bản được chuyển thành “dấu vân tay” lịch sử, giúp xác định bối cảnh rõ ràng hơn. Công cụ này cung cấp các đề xuất có thể giải thích rõ, phục vụ như điểm xuất phát cho chuyên gia nghiên cứu.
Ithaca – Công cụ phục hồi tiếng Hy Lạp cổ ứng dụng AI
Cùng dịp công bố Aeneas, DeepMind cũng nâng cấp mô hình Ithaca dành cho văn bản Hy Lạp cổ. Hiện nay, Ithaca được hỗ trợ khả năng phục hồi và nhận diện ngữ cảnh tương tự như Aeneas, mở rộng phạm vi ứng dụng AI trong lĩnh vực sử học và ngôn ngữ học cổ điển.
Google DeepMind đã phát hành Aeneas, mô hình AI giúp phục hồi và phân tích văn bản Latin cổ bị hư tổn một cách hiệu quả. Công cụ mở rộng khả năng của các chuyên gia sử học khi làm việc với nguồn tư liệu bị thiếu sót, và nay đã sẵn sàng sử dụng miễn phí cùng mã nguồn mở trên website của DeepMind.