Wordcloud | 风中有朵雨做的‘词云‘哦!~

这篇具有很好参考价值的文章主要介绍了Wordcloud | 风中有朵雨做的‘词云‘哦!~。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1写在前面

今天可算把key搞好了,不得不说🏥里手握生杀大权的人,都在自己的能力范围内尽可能的难为你。😂

我等小大夫也是很无奈,毕竟奔波霸霸波奔是要去抓唐僧的。 🤐

好吧,今天是词云Wordcloud)教程,大家都说简单,但实际操作起来又有一些难度,一起试试吧。😋

2用到的包

rm(list = ls())
library(tidyverse)
library(tm)
library(wordcloud)

3示例数据

这里我准备好了2个文件用于绘图,首先是第一个文件,每行含有n个词汇。🤣

dataset <- read.delim("./wordcloud/dataset.txt", header=FALSE)

DT::datatable(dataset)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

接着是第2个文件,代表dataset文件中每一行的label。🥸

dataset_labels <- read.delim("./wordcloud/labels.txt",header=FALSE)
dataset_labels <- dataset_labels[,1]
dataset_labels_p <- paste("class",dataset_labels,sep="_")
unique_labels <- unique(dataset_labels_p)

unique_labels
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

4数据初步整理

然后我们利用sapply函数把数据整理成list。😘

可能会有小伙伴问sapplylapply有什么区别呢!?😂

oksapply()函数与lapply()函数类似,但返回的是一个简化的对象,例如向量或矩阵。😜

如果应用函数的结果具有相同的长度和类型,则sapply()函数将返回一个向量。

如果结果具有不同的长度或类型,则sapply()函数将返回一个矩阵。😂

dataset_s <- sapply(unique_labels,function(label) list( dataset[dataset_labels_p %in% label,1] ) )

str(dataset_s)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

5数据整理成Corpus

接着我们把上面整理好的list中每个元素都整理成一个单独的Corpus。🤩

dataset_corpus <- lapply(dataset_s, function(x) Corpus(VectorSource( toString(x) )))

然后再把Cporus合并成一个。🧐

dataset_corpus_all <- dataset_corpus

6去除部分词汇

修饰一下, 去除标点、数字、无用的词汇等等。😋

dataset_corpus_all <- lapply(dataset_corpus_all, tm_map, removePunctuation)
dataset_corpus_all <- lapply(dataset_corpus_all, tm_map, removeNumbers)
dataset_corpus_all <- lapply(dataset_corpus_all, tm_map, function(x) removeWords(x,stopwords("english")))

words_to_remove <- c("said","from","what","told","over","more","other","have",
"last","with","this","that","such","when","been","says",
"will","also","where","why","would","today")

dataset_corpus_all <- lapply(dataset_corpus_all, tm_map, function(x)removeWords(x, words_to_remove))

7计算term matrix并去除部分词汇

document_tm <- TermDocumentMatrix(dataset_corpus_all)
document_tm_mat <- as.matrix(document_tm)
colnames(document_tm_mat) <- unique_labels
document_tm_clean <- removeSparseTerms(document_tm, 0.8)
document_tm_clean_mat <- as.matrix(document_tm_clean)
colnames(document_tm_clean_mat) <- unique_labels

# 去除长度小于4的term
index <- as.logical(sapply(rownames(document_tm_clean_mat), function(x) (nchar(x)>3) ))
document_tm_clean_mat_s <- document_tm_clean_mat[index,]

head(document_tm_clean_mat_s)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

8可视化

8.1 展示前500个词汇

comparison.cloud(document_tm_clean_mat_s, 
max.words=500,
random.order=F,
use.r.layout = F,
scale = c(10,0.4),
title.size=1.4,
title.bg.colors = "white"
)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

8.2 展示前2000个词汇

comparison.cloud(document_tm_clean_mat_s,
max.words=2000,
random.order=F,
use.r.layout = T,
scale = c(6,0.4),
title.size=1.4,
title.bg.colors = "white"
)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

8.3 展示前2000个common词汇

commonality.cloud(document_tm_clean_mat_s, 
max.words=2000,
random.order=F)
Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端

Wordcloud | 风中有朵雨做的‘词云‘哦!~,后端
最后祝大家早日不卷!~

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤩 LASSO | 不来看看怎么美化你的LASSO结果吗!?
📍 🤣 chatPDF | 别再自己读文献了!让chatGPT来帮你读吧!~
📍 🤩 WGCNA | 值得你深入学习的生信分析方法!~
📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

本文由 mdnice 多平台发布文章来源地址https://www.toymoban.com/news/detail-660426.html

到了这里,关于Wordcloud | 风中有朵雨做的‘词云‘哦!~的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python安装词云库wordcloud一文搞懂

    使用pip install wordcloud命令安装词云时,失败概率极大,因此词云库一般使用whl文件进行安装。 whl安装词云库步骤如下(同样适合安装其他whl文件的库) 1.下载wordcloud的whl文件 下载地址为:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2.选择合适的whl版本(重点) 很多人不知道下载哪个版

    2024年02月05日
    浏览(28)
  • 通过Python的wordcloud库将单词生成词云(心形形状)

    大家好,我是空空star,本篇给大家分享一下通过Python的wordcloud库将单词生成 词云(心形形状) 。 Python的wordcloud库是一个用于生成词云的Python包。它可以将一段文本中出现频率高的单词按其出现频率大小以及颜色深浅排列成一个词云图形,从而更好地展示文本中的信息。 使用

    2024年02月05日
    浏览(29)
  • 让你的作品更出色——词云Word Cloud的制作方法(基于python,WordCloud,stylecloud)

    词云Word Cloud的制作方法(基于python) 本文目录: 一、词云的简介 二、 实现原理和流程 1、制作词云流程图 2、词云实现原理 三、 实现词云的方式 1、安装词云相关模块库 2、WordCloud库 3、stylecloud库 四、总结 词云,又称文字云,英文名:Word Cloud。是文本数据的视觉表示形式。

    2023年04月09日
    浏览(34)
  • 前端处理后端返回的数据中有\n\n字样的换行符标识

    后端返回的数据: 上面圈着的部分就是n,前端需要将数据进行换行,对于这类型的数据,在前端页面是需要进行稍微处理才能正常显示。如果没有经过处理,那么内容是不会在有换行符的位置进行换行显示的 解决办法1: 使用css属性: pre-wrap:连续的空白符会被保留。在遇到

    2024年02月07日
    浏览(29)
  • VUE 实现 3D词云 旋转词云效果

     效果视频: 3D词云

    2024年02月05日
    浏览(31)
  • python安装wordcloud包报错:No module named ‘wordcloud‘

    直接在cmd使用pip install wordcloud进行安装后,在jupyter notebook中导入wordcloud包会报错 发现是因为没有安装在anaconda的路径里 解决方法:打开anaconda prompt进行pip install wordcloud,安装完成后可以在jupyter环境中成功导入 去年这时候安过一次wordcloud包,当时好像也有这个问题,没有及时

    2024年02月11日
    浏览(38)
  • 【Python | 词云】聊天记录绘制超美词云(七夕快乐 ,曾同学)

    解释器: python.3.9 编译器: jupyter notebook 时间: 8/4 10:20 本次聊天记录是收集于我和曾同学 QQ 一年以来的聊天记录,一起看看你们情侣间说过最多的是哪句话吧! 代码 每条信息共同点都是: 使用 re 模块 去除不需要的 [图片] , 用户名和 换行符 n , 以及日期和高频率的系统消

    2024年02月10日
    浏览(26)
  • 【python 的各种模块】(8) 在python使用matplotlib和wordcloud库来画wordcloud词云图

    目录 目标:用python画出,网上流行的wordcloud词云图 1 准备工作 1.1环境准备 1.1.1安装步骤 1.2 资源准备 1.2.1  文本文件内容如下 1.2.2 图片资源 2 代码测试 2.1 第一版代码和效果 2.1.1 代码和效果 2.1.2 一般plt里解决中文乱码问题 2.1.3 wordcloud的中文显示方框解决办法 2.2 修改后的代

    2024年02月03日
    浏览(57)
  • Python数据可视化——Python创建词云创建心形词云(MacWindows都可以运行)

    作者:大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主 关注我能学习到大数据、Python数据分析,以及各种自我提升小技巧 摘要:在本博客中,我们将介绍如何使用Python创建形状词云。我们将使用WordCloud库、NumPy、PIL和Matplotlib创建一个简单而有趣的心形词云。通过本文

    2023年04月23日
    浏览(29)
  • jieba和WordCloud

    词云图像 结果  

    2024年02月16日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包