探索古彝文AI识别技术:助力中国传统文化的传承与发扬

这篇具有很好参考价值的文章主要介绍了探索古彝文AI识别技术:助力中国传统文化的传承与发扬。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

⭐️ 写在前面

⭐️ 一、什么是古彝文

1.1 古彝文介绍

1.2 古彝文与其他古文字示例

1.3  古彝文的重要性

⭐️二、AI识别技术的挑战与前景

2.1 挑战

2.2 前景

⭐️三、合合信息AI识别技术

3.1 智能文字识别技术👍👍

3.2 古文识别应用

⭐️四、AI技术效果

4.1 猜字识字

4.2 AI文档能力修复古籍

⭐️五、中秋祝福💝🫶


探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

⭐️ 写在前面

随着科技的不断发展,OCR(Optical Character Recognition,光学字符识别)技术在各个领域得到了广泛应用。

-

近年来,古彝文作为一种具有悠久历史和独特魅力的文字,逐渐受到了学者们的关注。探索古彝文识别OCR技术,不仅有助于挖掘、整理和传承中国传统文化,还能为现代科技与文化的交流搭建桥梁。

⭐️ 一、什么是古彝文

1.1 古彝文介绍

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

彝文指的是云南、贵州、四川等地的彝族人使用的文字,其造字、使用方法在不同的区域之间表现出明显的差异。

1980年发布的四川规范彝文有819字,2012年发布的滇川黔桂通用彝文有5598字。

这两种彝文主要用于现代语境,在仪式、节庆、旅游景点等场合彰显彝族非物质文化遗产的传承,或用于民族地区相关政策和宣传文件的翻译,以及当代母语作家文学的创作。

区别于上述现代意义上的彝文,今天我们所谓的“古彝文”指的是在民间流通使用的原生态彝文,根据《滇川黔桂彝文字集》,这些文字多达87046字。

彝文起源于何时,尚未有官方的定论。有学者认为,古彝文的起源距今至少数千年,是世界上最古老的文字之一。

下图是毕节市彝文文献翻译研究中心展示古籍修复原件

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

下图是毕节市彝文文献翻译研究中心展示汉译书稿

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

1.2 古彝文与其他古文字示例

如下图所示,分别是:

  • 古埃及文字
  • 古埃及象形文章
  • 象形文
  • 古彝文字义
  • 古彝文字

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

可以看到,古彝文与其他古文字中可能存在某些相似关联

1.3  古彝文的重要性

对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。

⭐️二、AI识别技术的挑战与前景

AI技术在古彝文识别方面有着巨大的潜力,但也面临一些挑战。可以分为以下几个方面:

  1. 版式多样,文字识别存在挑战
  2. 手写风格差异很大,手写识别难
  3. 彝文古籍图像质量差
  4. 彝文字笔画相近,增加AI识别难度

2.1 挑战

2.1.1 版式多样

汉文与彝文古籍的各类原稿的排版风格都不统一,字符间距和行距有密有疏,彝文古籍虽然没有大小字混排、双列夹字的校注传统,但也时常出现加字、替字、整句倒置和文字方向不统一等现象,这样会给文字定位造成挑战。

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

2.1.2 手写识别难

和汉文古籍一样,不同的彝文缮写员之间手写风格差异很大,这就需要大量的数据库来建立识别模型。

👇

古彝文目前没有公开数据集,而通晓此种文字的人越来越少,导致标注工作量大而人手少,数据量严重不足,亟须引入AI技术构建模型,以弥补本项目训练样本不足。

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

2.1.3 图像质量差

汉文和彝文古籍都经历了数代传承、战火与自然风蚀的洗礼,难免出现页面残缺、霉斑污渍等影响图像质量问题。

此外,由于彝文古籍的保存环境更为艰苦,文本还呈现墨色深浅不一、字符间距和行距大小不一的情况。合合信息智能文字识别技术可对图像质量进行增强,提升文字识别效率与准确性。

2.1.4 笔画相近,增加识别难度:

彝文字从来没有统一过,不仅异体字(两个或多个视觉上完全不同的字)很多,还存在大量的“变体字”,也即各个地方的布摩为防止敌方破译其经书而故意在现有字形上增加或减少一两个笔画产生的。

比如:下图中表示“种类”的彝文字[mo21]/[mɯ33]的四个变体(邵文苑供图)

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

比如下面两个形似,但是确实两个完全不同的文字,分别为“酒”、“仪礼”

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

2.1.5 异体众多

古彝文每个字的异体写法少则2-3个,多则几十种,前文已提及未经整理规范的古彝文字符数高达了87000余个,比康熙字典的字数还多,给识别带来极大困难。

除此以外,彝文古籍还存在“同音字混用”的现象:为了不使某些字的写法失传,布摩会在抄写两句重复经文时,会故意让第一句话采用本字,而在第二句中的相同位置用同音字来替换,合合信息智能文字识别技术将有助于应对文字识别中“理解、认知”层面的难题。

2.2 前景

随着科技的不断发展,这些挑战是可以克服的。古彝文是中国传统文化中的重要组成部分,其传承与发扬具有深远的意义。

AI识别技术为古彝文的识别和传承提供了有力的工具,可以帮助我们更好地理解和传承彝族文化。通过AI识别技术,我们可以将古彝文带入数字时代,为中国传统文化的传承和发扬做出新的贡献,让这一宝贵的文化遗产得以继续传承下去。

⭐️三、合合信息AI识别技术

3.1 智能文字识别技术👍👍

智能文字识别技术是合合信息核心技术之一,主要由智能图像处理、基于深度学习的复杂场景文字识别,自然语言处理(NLP)三大核心模块组成。

其中,智能图像处理技术可对曲面、阴影、摩尔纹等文档图像进行精准的矫正处理,为接下来的文字信息提取、识别创造了良好的条件;复杂场景文字识别技术可适应多语言、多版式、多样式等复杂场景,以进行文字提取,并结合领先的NLP技术,对识别出的结果进行语义理解。

近三年来,合合信息智能文字识别技术先后在ICDAR、ICPR等人工智能国际竞赛中斩获16项冠军,学术成果在CVPR、AAAI、ACL等顶会上发表,相关项目获中国图象图形学学会(CSIG)科技进步奖二等奖。

3.2 古文识别应用

合合信息在古文字识别领域已有了一定的积累和成果。在2021年、2022年的世界人工智能大会上,合合信息展现了智能文字识别技术在甲骨文、西周钟鼎文(金文)中的应用,获得了包括央视、人民日报、新华社等上百家主流媒体的关注。

虽然古彝文的识别研究尚处于起步阶段,但在引入先进的AI技术来建立统一的数据库以后,对于增强古彝文研究的连续性、降低繁琐的检索工作无疑有极大帮助。与古彝文数字化相关的研究目前还相对稀少,本项目将填补当前国内外研究的空白。

在过去的十几年中,合合信息以智能文字识别技术为核心,在图像的复杂版式识别、结构化智能理解层面做了大量的研究,并取得优秀的应用效果,为古彝文识别提供了技术支持。

校企合作

2022年12月21日,合合信息与上海大学社会学院正式签署校企合作协议,旨在完成以国家珍贵古籍《西南彝志》为中心的“贵州古彝文图像识别及数字化校对项目”。

👏👏👏👏

双方将不断探索用智能文字识别技术赋能海量古彝文原籍数字化的道路,这一工作在民族传统文化日渐濒危的当下有着独特的意义。

合合信息前期在甲骨文、金文中所作的研究,也让古彝文识别成为一件“水到渠成”的事情:甲骨文和古彝文追溯源头都属于骨刻文,文字自骨刻文起,后发展出甲骨文、金文、小篆、隶书、楷书等,文字间的识别有相通之处。

此次与上海大学联合开启的“贵州古彝文图像识别及数字化校对项目”校企合作,也成为合合信息智能文字识别技术赋能小语种保护及古文化传承的重要里程碑事件。

⭐️四、AI技术效果

4.1 猜字识字

合合信息旗下扫描全能王与上海大学、华南理工大学共同研发识别古彜文基础编码已经完成,此基础编码将帮助后续古彜文的检测、识别、标注,帮助学者解读更多古彜文古籍。

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

4.2 AI文档能力修复古籍

AI文档能力修复古籍呈现高清

  • 利用智能高清滤镜将古籍水印、残旧等痕迹去除复现高清古籍
  • 相关识别及古彜文编码仍在测试完善中

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

⭐️五、中秋祝福💝🫶

中秋快到啦,我们用古彝文写一个中秋祝福吧!来看下🙉🙉

猜猜这是什么意思?👇👇

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划

哈哈哈,肯定猜不到,这个祝福送给大家:✌️✌️😘

愿:

身体倍棒,

多吃多走多看看,

少病少痛少感冒

探索古彝文AI识别技术:助力中国传统文化的传承与发扬,人工智能,AI模型系列,大模型,人工智能,AI识别,算法,前言技术,原力计划文章来源地址https://www.toymoban.com/news/detail-715875.html

到了这里,关于探索古彝文AI识别技术:助力中国传统文化的传承与发扬的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能驱动的古彝文识别:保护和传承古彝文文化

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 引言 一、古彝文的背景 1.1古彝文的起源和发展 1.2古彝文的文化和历史价值 1.3古彝文古

    2024年02月08日
    浏览(34)
  • 探索AI领域,AI图像安全技术助力行业健康发展

    大家好,我是哪吒。 去年11月ChatGPT横空出世之后,生成式AI向人们展示出了自己的强大力量,各种大模型如雨后春笋一样涌现,并实现了大规模的商业化。 闲暇之余,我也研究了一番,发现AI在图像处理领域具有许多卓越的优点。其中一项突出的优势是,AI可以快速准确地处

    2024年02月13日
    浏览(31)
  • 枫叶时代:打造中国特色的传统文化IP

    近年来,取材于传统文化的影视作品在文化产业市场受到前所未有的关注。作为一种兼具辨识度、影响力和流量变现能力的文化符号,影视IP既是文化产业的一个重要环节,也是国家文化软实力的直接体现。优秀的影视IP可以超越文字、语言、民族的障碍,成为价值理念传播的

    2024年02月14日
    浏览(35)
  • 计算机毕业设计基于Node.js的戏曲演员购票微信小程序:传承与发扬中国传统文化的非遗实践

    摘要 随着信息技术的飞速发展,微信小程序作为一种新兴的移动应用形态,已逐渐渗透到人们生活的各个方面。本文旨在探讨如何结合Node.js技术,设计并实现一款面向戏曲演员的购票微信小程序,以此作为中国传统文化非遗传承与发扬的新途径。文章首先分析了戏曲演员购

    2024年03月20日
    浏览(38)
  • 探索AI图像安全,助力可信AI发展

    随着人工智能( Artificial Intelligence , AI )技术的发展,已经逐渐成为生活中不可或缺的一部分,为我们的生活带来了诸多便利和创新,但与此同时也带来了一系列的安全挑战,例如恶意篡改、图像造假等。在追求技术进步和拓展人工智能应用边界的同时,我们必须高度关注人工

    2024年02月16日
    浏览(28)
  • 中国模式识别与计算机视觉大会|多模态模型及图像安全的探索及成果

    随着人工智能技术的不断演进,多模态大模型已是当下比较热的研究方向,它可以同时理解和生成多种输入和输出模态,如文本、图像、语音等,能够更好地模拟人类的多感知能力,给文档图像的分析处理带来了新的机遇和挑战! 近期,中国模式识别与计算机视觉大会在厦门

    2024年02月08日
    浏览(35)
  • 让保险更“保险”!麒麟信安一云多芯云桌面中标中国人寿, 助力金融保险信息技术创新发展

    近日,《中国人寿保险股份有限公司2021年第二批电子化设备项目》、 《中国人寿保险股份有限公司2021年第三批电子化设备公项目》发布中标公示,麒麟信安凭借在桌面云领域的领军实力,成功打开金融保险行业新版图,正式成为中国人寿信创上云供应商。 中国人寿保险股份

    2024年02月16日
    浏览(32)
  • AI智能识别如何助力PDF,轻松实现文档处理?

    随着科技的不断发展,人工智能(AI)在各个领域都发挥着重要的作用。其中,文档智能( Document AI )在金融、医疗、教育、保险、能源、物流等多个行业均有不同类型的应用,为PDF文档处理带来了极大的便利和效率提升。 文档智能( Document AI )主要包括文档版面分析、文

    2024年02月06日
    浏览(35)
  • AI图像识别算法助力安全生产*提升风险监测效率---豌豆云

    2024年开年来安全生产事故频发,工厂爆炸、工程坍陷等重大安全生产事故的发生再次为我们敲响了警钟。 安全生产是企业发展的生命线,而传统的安全监测手段存在盲区和延迟,难以及时发现和应对潜在风险。 AI图像识别算法通过利用先进的计算机视觉和深度学习技术,能

    2024年04月17日
    浏览(49)
  • 中国留学生被“虚拟绑架”?AI让电信诈骗更加逼真,我们该怎么识别?

    近日,一起针对海外留学生群体的新型电信网络诈骗案引发关注。中国驻美国使馆发言人证实,一名疑似遭绑架的中国留学生实际上遭遇了“虚拟绑架”诈骗。 诈骗分子冒充公检法机关、使馆、海关等工作人员,以涉嫌犯罪为名出示伪造的通缉令、逮捕证,恐吓受害人。他们

    2024年02月19日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包