破译水平接近专家!谷歌AI解读古籍核心错误率仅0.56%

内容摘要快科技11月16日消息,据媒体报道,谷歌旗下AI Studio平台正在测试一款未命名的AI模型,在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为0.56%,准确率已接近该领域的专业研究人员水平。历史学家Mark Hu

快科技11月16日消息,据媒体报道,谷歌旗下AI Studio平台正在测试一款未命名的AI模型,在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为0.56%,准确率已接近该领域的专业研究人员水平。

历史学家Mark Humphries利用专门构建的基准数据集对模型进行了系统评估。在测试涵盖的五份18至19世纪高难度手稿中,模型整体字符错误率约为1.7%,其中大部分错误出现在标点符号和大小写规范等非核心问题上,并未影响单词本身的正确识别。

破译水平接近专家!谷歌AI解读古籍核心错误率仅0.56%

若排除这些非关键性错误,模型的字符错误率可进一步降至0.56%,相当于每转写200个字符仅出现一处实质性错误,其表现已与专注于文献转写的专业工作者相当。

测试手稿涵盖了多样化的书写风格,包括字迹潦草、拼写非标准和语法不一致等复杂情况,充分验证了模型的强适应能力。更值得注意的是,该模型不仅能完成文字转写,还展现出一定的上下文推理能力。

例如,在处理一份18世纪商人日记时,模型遇到一条未标注单位的购糖记录 145 。它通过反向核对账目总额,结合当时英国的货币与重量单位体系,成功推断出该数字代表 14磅5盎司 。

Humphries也指出当前评估仍存在一定局限。由于该模型仅以A/B测试形式零星出现,难以进行大规模系统性验证,目前仅完成基准数据集中约10%样本的评估工作。

破译水平接近专家!谷歌AI解读古籍核心错误率仅0.56%

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: