N-Gram语言模型工具kenlm的详细安装教程

这篇具有很好参考价值的文章主要介绍了N-Gram语言模型工具kenlm的详细安装教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【本配置过程基于Linux系统】

下载源代码:

wget -O - https://kheafield.com/code/kenlm.tar.gz |tar xz

N-Gram语言模型工具kenlm的详细安装教程


 编译:

makdir kenlm/build
cd kenlm/build
cmake .. && make -j4

发现报错:

N-Gram语言模型工具kenlm的详细安装教程 

系统中没有cmake,按照错误提示,执行以下命令:

sudo apt-get install cmake

安装完成后,再次cmake:

cmake ..

 又报错:

N-Gram语言模型工具kenlm的详细安装教程

 找不到boost,那么就下载它:

sudo apt install libboost-dev libboost-test-dev

安装完成后继续cmake,无语,还报错: N-Gram语言模型工具kenlm的详细安装教程

boost依赖包没装全,索性全装了:

sudo apt-get install libboost-all-dev

对于eigen3这个包,尝试了网上说的方法:

cd ~ && wget -O - https://bitbucket.org/eigen/eigen/get/3.2.8.tar.bz2 |tar xj

有问题:

N-Gram语言模型工具kenlm的详细安装教程 

继续尝试

sudo apt-get install libeigen3-dev

N-Gram语言模型工具kenlm的详细安装教程

没问题,继续cmake,发现又有包找不到:

N-Gram语言模型工具kenlm的详细安装教程 

根据提示的两个包,下载它们:

sudo apt-get install libbz2-dev liblzma-dev
cmake ..

 N-Gram语言模型工具kenlm的详细安装教程

终于不报错了。然后编译:

sudo make -j4

接下来等待编译的完成:

N-Gram语言模型工具kenlm的详细安装教程

编译完成后,执行下载:

sudo make install 

 N-Gram语言模型工具kenlm的详细安装教程

OK, kenlm安装完成~ 文章来源地址https://www.toymoban.com/news/detail-497110.html

到了这里,关于N-Gram语言模型工具kenlm的详细安装教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 自然语言处理: 第一章N-Gram

    定义: 语言模型在wiki的定义是 统计式的语言模型 是一个几率分布,给定一个长度为 m 的字词所组成的字串 W1 , W2 ,··· ,Wn ,派几率的字符串P(S) = P(W1 , W2 ,··· ,Wn , )而其中由条件概率公式我们可以得到下图2的公式,然后我们再利用马尔可夫假设(每个词的出现的概率只

    2024年02月09日
    浏览(50)
  • 【自然语言处理】【深度学习】NLP中的N-gram理解

    N-gram是自然语言处理(NLP)中的一个概念,它描述的是文本中连续的n个项(通常是单词或字符)。这个概念主要用于语言建模和文本分析中。 具体来说: Unigram (1-gram): 包含一个单词的序列,例如句子中的单个单词。 Bigram (2-gram): 包含两个相邻单词的序列。例如,在句子 “

    2024年01月25日
    浏览(57)
  • Elasticsearch对数字,英文字母等的分词N-gram tokenizer

    Elasticsearch中提供了一个叫N-gram tokenizer的分词器,官方介绍如下 The  ngram  tokenizer first breaks text down into words whenever it encounters one of a list of specified characters, then it emits N-grams of each word of the specified length. N-grams are like a sliding window that moves across the word - a continuous sequence of charac

    2023年04月16日
    浏览(38)
  • 深度学习 - 40. N-Gram 采样与 Session 数据获取 For EGES

    目录 一.引言 二.订单数据预处理 1.数据样例 2.订单数据处理 3.用户 Session 构建 三.构造 sku_id 游走序列 1.获取完整 Session List 2.统计 sku_id 转移词频 3.构建 sku_id 图 4.游走构造 sku 序列 四.商品侧信息预处理 1.读取商品信息 2.Left Join 匹配侧信息 3.Id2Index 构建 五.基于 Ngram 与 Negat

    2023年04月23日
    浏览(32)
  • 【自然语言处理】理解词向量、CBOW与Skip-Gram模型

    由于计算机不能直接对各种字符进行运算,为此需要将词的表示进行一些转换。因此,在自然语言处理中,通常需要对输入的语料进行一些预处理: 其中,如何对词汇进行表示是很关键的问题,糟糕的表示方法容易导致所谓的 “Garbage in, garbage out”。 对词汇的表示,常见的

    2024年02月08日
    浏览(46)
  • 黑客工具之sqlmap安装教程,超详细使用教程(附工具安装包)

    一、sqlmap简介 sqlmap支持MySQL, Oracle,PostgreSQL, Microsoft SQL Server, Microsoft Access, IBM DB2, SQLite, Firebird,Sybase和SAP MaxDB等数据库的各种安全漏洞检测。 sqlmap支持五种不同的注入模式: 基于布尔的盲注,即可以根据返回页面判断条件真假的注入 基于时间的盲注,即不能根据页面返回内容

    2023年04月10日
    浏览(40)
  • R 语言的安装(详细教程)

    我不生产知识,我只是知识的搬运工,以下内容是源于 B站 - 徐州更 的安装教程:可能是最好的R语言安装指南哔哩哔哩bilibili 个人是觉得 R 的安装是比较麻烦的,所以我将他讲的安装视频稍作修饰写成文档的形式,方便今后我或者其他人查阅 R语言是用于统计分析、绘图的语

    2023年04月09日
    浏览(33)
  • StarUML建模工具破解安装详细教程,保姆级教学!

    1. 下载安装包 首先我们进入StarUml官网下载安装包 点击Downloads也可以选择自己想要的版本 2.安装StarUML 下载好后,双击进行安装即可 然后就可以进入首页,提示注册信息,这时候我们可以不管,直接退出即可。 三、破解StarUML (1)安装Node.js 因为破解StarUML需要Node.js的环境,

    2024年02月02日
    浏览(40)
  • [网络安全] Dirsearch 工具的安装、使用详细教程

    Dirsearch 是一个用于探测Web服务器上的隐藏目录和文件的工具。它通过发送HTTP请求来尝试访问可能存在的路径,从而找到不列在网站目录页面上的隐藏资源。 Dirsearch 的主要特点包括: 1.多线程:Dirsearch 采用多线程方式进行目录扫描,充分利用系统资源提高扫描效率。 2.字典

    2024年02月08日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包