Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)

这篇具有很好参考价值的文章主要介绍了Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)

日语因为存在假名,会导致翻译软件进行翻译时机翻味道过重的问题,比如積ん読(つんどく)这个词,大多数软件会翻译成:堆积的读,但其实是明明买了书却不读,光放着的意思。有时候也需要单独查句子中的单词释义来理解句子的意思,但一看下去全是假名,无法像中文或者英文那样进行简单的分词操作。

本次我们基于Python3.10的三方库Mecab来对日语进行分词和词性分析。

安装和配置Mecab

首先下载最新的Mecab0.996的64位安装包:

https://github.com/ikegami-yukino/mecab/releases

随后双击进行安装,注意编码选择国标码utf-8:

默认的Shift_JIS是日本电脑系统常用的编码表,能容纳全形及半形拉丁字母、平假名、片假名、符号及日语汉字。

当然如果您的电脑是日本系统,那就选择Shift_JIS,但utf-8是通用的。

安装成功后,最好把bin目录添加到系统的环境变量中。

动态库DLL not found问题

随后安装对应的Python依赖:

pip install mecab-python3

随后导入到Mecab库可能会报DLL not found。

这是因为系统找不到Mecab的运行库libmecab.dll

此时,可以考虑将Mecab安装目录中的bin目录里的libmecab.dll拷贝到系统的C:/windows/system32目录中。

因为在Windows操作系统中,DLL文件是动态链接库文件,其中包含许多可供其他程序调用的功能。如果您想要让一个程序能够使用一个DLL文件,需要确保该DLL文件已经正确地安装到系统目录中,而system32就是Win11系统的动态库安装目录。

言而总之,将DLL文件放到C:\Windows\System32目录下可以让其对其他程序可见,但需要注意用户权限问题。

Mecab日语分词和词性解析

随后编写代码test.py:

import MeCab  
  
CONTENT = "私はpythonを使用して、プログラミングを勉強しています。積ん読"  
  
tagger = MeCab.Tagger()  
parse = tagger.parse(CONTENT)  
  
print(parse)

运行结果:

PS D:\jiyun\积云\boo3_public> python -u "d:\jiyun\积云\boo3_public\mecab_test.py"  
私      ワタクシ        ワタクシ        私-代名詞       代名詞                  0  
は      ワ      ハ      は      助詞-係助詞  
python  python  python  python  名詞-普通名詞-一般                      0  
を      オ      ヲ      を      助詞-格助詞  
使用    シヨー  シヨウ  使用    名詞-普通名詞-サ変可能                  0  
し      シ      スル    為る    動詞-非自立可能 サ行変格        連用形-一般     0  
て      テ      テ      て      助詞-接続助詞  
、                      、      補助記号-読点  
プログラミング  プログラミング  プログラミング  プログラミング-programming      名詞-普通名詞-サ変可能                  4  
を      オ      ヲ      を      助詞-格助詞  
勉強    ベンキョー      ベンキョウ      勉強    名詞-普通名詞-サ変可能                  0  
し      シ      スル    為る    動詞-非自立可能 サ行変格        連用形-一般     0  
て      テ      テ      て      助詞-接続助詞  
い      イ      イル    居る    動詞-非自立可能 上一段-ア行     連用形-一般     0  
ます    マス    マス    ます    助動詞  助動詞-マス     終止形-一般  
。                      。      補助記号-句点  
積ん読  ツンドク        ツンドク        積ん読  名詞-普通名詞-一般

可以看到这里将私はpythonを使用して、プログラミングを勉強しています。積ん読这个完整的日文句子切分成了单词,并且标注了词性,比如前文提到的積ん読这种词。

如果是大型的文本,也能以读文件的方式来进行切分和释义:

import MeCab  
  
FILE_NAME = "sample.txt"  
  
with open(FILE_NAME, "r", encoding="utf-8") as f:  
    CONTENT = f.read()  
  
tagger = MeCab.Tagger()  
parse = tagger.parse(CONTENT)  
  
print(parse)

注意这里读文件时需要声明编码是utf-8。

程序返回:

私      名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ  
は      助詞,係助詞,*,*,*,*,は,ハ,ワ  
python  名詞,一般,*,*,*,*,*  
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ  
使用    名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー  
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ  
て      助詞,接続助詞,*,*,*,*,て,テ,テ  
、      記号,読点,*,*,*,*,、,、,、  
プログラミング  名詞,サ変接続,*,*,*,*,プログラミング,プログラミング,プログラミング  
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ  
勉強    名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー  
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ  
て      助詞,接続助詞,*,*,*,*,て,テ,テ  
い      動詞,非自立,*,*,一段,連用形,いる,イ,イ  
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス  
。      記号,句点,*,*,*,*,。,。,。 

结语

Mecab最初由奈良先端科学技术大学院大学开发,目前由工藤拓(Taku Kudou)维护,作为Google日语输入项目的一部分。MeCab的名称源自开发者最喜欢的食物“mekabu”(和布蕪),这是一道由裙带菜叶制成的日本菜肴。

MeCab的优势包括准确的分析日语、快速的分析速度以及对不同操作系统的跨平台支持。 MeCab是日语文本处理的重要工具,为日语文本分析和处理提供了强大的支持。文章来源地址https://www.toymoban.com/news/detail-771851.html

到了这里,关于Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Win11动态磁贴没了?Win11中恢复动态磁贴的方法

    Win11动态磁贴没了?最近有小伙伴们在后台私信小编说自己更新到Win11系统后却发现Win10原来有的动态磁贴不见了,自己又十分的喜欢这个功能,想把这个功能恢复,那要如何设置呢? 这里有小白一键重装系统的方法可以看看 ​ Win11中恢复动态磁贴的方法: 注:动态磁贴一直

    2024年02月06日
    浏览(38)
  • Win11使用动态磁贴还原经典Win10开始菜单的方法

    Win11系统界面与之前的Windows系统有很大的不同,任务栏采用居中式,开始菜单也居中了。很多用户升级之后就觉得用得非常不习惯,想要将Win11开始菜单还原到Win10系统的样子。那么下面就来看看Win11怎么使用动态磁贴还原经典Win10开始菜单的教程。 具体操作步骤如下: 1、首

    2024年02月15日
    浏览(44)
  • win10、win11下WSL2环境安装

    微软官方wsl手册 微软官方wsl手册pdf 打开win10的设置,搜索windows功能,打开启用或者关闭Windows功能(win11可能搜不到,需要在控制面板里面搜索) 勾选以下2个地方,并重启,也有可能是中文名字“虚拟机平台” 下载WSL2升级包,并点击安装 WSL2升级包 以管理打开Powershell,并执行

    2023年04月17日
    浏览(39)
  • 详细分析Win11与Win10哪个好用

    Windows 11是由微软公司(Microsoft)开发的操作系统,应用于计算机和平板电脑等设备。于2021年6月24日发布,2021年10月5日发行。 Windows 11提供了许多创新功能,增加了新版开始菜单和输入逻辑等,支持与时代相符的混合工作环境,侧重于在灵活多变的体验中提高最终用户的工作

    2024年02月06日
    浏览(30)
  • 最新win11配置cuda以及cudnn补丁教程

    1、首先使用指令 nvidia-smi 查看电脑支持的** 最高cuda **版本,例如: 本机 12.2 2、进入CUDA下载cuda安装包 https://developer.nvidia.com/cuda-toolkit-archive 2、点击 上方绿色的链接 ,按照图中序号选择的即可,最后点击下载。 **安装时候展开CUDA,后取消勾选图中内容之后,一直next即可*

    2024年04月22日
    浏览(31)
  • jdk11下载、安装及环境配置详解(win10环境)

    1.1、官网下载网址 https://www.oracle.com/java/technologies/downloads/#java11-windows 1.2、官网下载步骤 点击官网下载地址后,选择对应的系统环境,下载即可,如下图: 下载好安装包后,双击.exe程序,弹出如下窗口,点击【下一步】 更改安装目录,点击【下一步】,如下图: 等待安装,

    2024年01月15日
    浏览(78)
  • VScode配置Python虚拟环境(Win11)

            这里选用基于Anaconda的解释器,Anaconda是Python的发行版,包含解释器以及一系列库,以及软件包管理器Conda。         在“清华大学开源镜像站”下载Anaconda。(网站:mirrors.tuna.tsinghua.edu.cn)。           点击Archive ,找到发行时间较近的Anaconda3版本。    

    2024年02月02日
    浏览(44)
  • Python3.10动态修改Windows系统(win10/win11)本地IP地址(静态IP)

    一般情况下,局域网里的终端比如本地服务器设置静态IP的好处是可以有效减少网络连接时间,原因是过程中省略了每次联网后从DHCP服务器获取IP地址的流程,缺点是容易引发IP地址的冲突,当然,还有操作层面的繁琐,如果想要切换静态IP地址,就得去网络连接设置中手动操

    2024年02月03日
    浏览(55)
  • 【Windows环境搭建】Win11 安装 MySQL 8

    系统:Win 11 MySQL版本:mysql 8 ⚠️有些步骤第一次安装时没有截图,是在给其他电脑进行安装时补上截图的,因此会出现前后文件路径不一致的情况。本文图片仅供参考,一切以文字内容为准。 官网下载地址:download 不要使用exe安装,使用zip压缩包安装 exe安装光是勾选就要十

    2024年02月03日
    浏览(52)
  • 【adb】--- win11 配置 adb环境 超详细

    在编程的艺术世界里,代码和灵感需要寻找到最佳的交融点,才能打造出令人为之惊叹的作品。 而在这座秋知叶i博客的殿堂里,我们将共同追寻这种完美结合,为未来的世界留下属于我们的独特印记。 开发环境:windows11 adb官网下载 选择Windows版本 确认下载 下载下来的压缩

    2024年02月05日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包