R语言丨根据VCF文件设计引物，自动识别两样本差异SNP位点，调用samtools获取上下游参考序列

9月前作者：生信分析笔记分类：Toy博客阅读(37) 违法举报

这篇具有很好参考价值的文章主要介绍了R语言丨根据VCF文件设计引物，自动识别两样本差异SNP位点，调用samtools获取上下游参考序列。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

根据变异位点设计引物序列

今天碰到一个新问题：假如有一个vcf文件储存了两个样品的变异位点基因型数据，每行代表一个位点，我现在想找出两样本差异的SNP位点，再把差异位点用[REF/ALT]的形式表示，然后将其在参考基因组上下游100bp的序列找出来放在差异位点前后位置，得到一个序列文本，用于设计引物。

解决思路

如何判断差异SNP？

通过循环判断两个样品的基因型信息实现，相同时为same，不同时为diff
如何提取差异位点？

通过tidyverse系列函数filter实现筛选，只选取s开头的SNP位点
如何获取参考基因组某段序列？

通过samtools调用faidx功能实现序列查询
如何生成引物设计信息？

通过合并字符串生成最终结果

下面是详细的实现方法，可以批量对vcf文件的差异位点生成引物设计数据，测试环境为linux R4.2.3，支持云端计算，如有建议或者需要欢迎联系后台交流。

1. 加载所需的库

首先，需要加载两个R包：vcfR和tidyverse。这两个包提供了处理VCF文件和数据处理的功能。文章来源地址https://www.toymoban.com/news/detail-557602.html

library(vcfR)
library(tidyverse)

到了这里，关于R语言丨根据VCF文件设计引物，自动识别两样本差异SNP位点，调用samtools获取上下游参考序列的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

shell使用文件通配符{}，变量自动添加单引号，无法识别问题

脚本关键部分如下：获取一周七天的日期，然后利用通配符，直接查看七天内的文件 weekdays=`/opt/uploadcheck/calculateDate.sh $start_week $end_week` weekdays=`echo $weekdays | awk \\\'{ gsub(/ /,\\\",\\\"); print $0 }\\\'` echo $weekdays zcat /opt/a_\\\"{$weekdays}\\\"_00_001.csv.gz 执行出现错误，通配符没有被解析，而是被当作整

2024年02月10日
浏览(55)
wpf C# 用USB虚拟串口最高速下载大文件每包400万字节平均0.7s/M，支持批量多设备同时下载。自动识别串口。源码示例可自由定制。

C# 用USB虚拟串口下载大文件每包400万字节平均0.7s/M。支持批量多设备同时下载。自动识别串口。可自由定制。 int 32位有符号整数 -2147483648~2147483647 但500万字节时 write时报端口IO异常。可能是驱动限制的。之前用这个助手发文件，连续发送，会被分包1024byte/包。速度会慢下来

2024年02月09日
浏览(45)
什么是自动语音识别?

在人工智能发展和全球疫情的双重作用下，企业加强了与客户的线上沟通。企业越发依赖于虚拟助手、聊天机器人以及其他的语音技术，以实现与客户的高效互动。这几类人工智能，都是依赖于自动语音识别技术，简称为ASR。ASR涉及到将语音转换为文本，促使计算机理解人类

2024年02月10日
浏览(49)
河道垃圾自动识别监测算法 opencv

河道垃圾自动识别监测系统通过python+opencv网络模型技术，河道垃圾自动识别监测算法对水面上的垃圾进行自动识别，一旦发现垃圾污染将自动发出警报。OpenCV基于C++实现，同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API，结合了OpenCV C++API和Python语言的最佳

2024年02月11日
浏览(45)
Python实现条码识别：从图像中自动检测和识别条形码

Python实现条码识别：从图像中自动检测和识别条形码在现代零售业中，条形码是一项必不可少的技术。它们提供了一种快速、准确和可靠的方法来追踪和管理库存。随着计算机视觉技术的发展，我们可以利用Python编写程序来自动检测和识别图像中的条形码。在本篇文章中，我

2024年02月16日
浏览(43)
使用Python进行自动语音识别

自动语音识别（ASR）是将口头语言转换为书面文本的过程。 ASR技术已经存在多年，但随着机器学习和深度神经网络的进步，它变得更加准确可靠。在本文中，我们将探讨如何使用Python和Hugging Face Transformers库执行ASR，同时利用PySide6设计了一个简单的GUI界面，演示如下所示：

2023年04月08日
浏览(41)
AutoRunner自动化测试工具新版本智能识别算法之视觉识别

泽众AutoRunner（简称AR）是国内专业的支持C/S、B/S各种技术框架的、基于组件识别的自动化测试工具，实现7*24小时的自动化回归测试和功能测试，让测试更智能。视觉识别是一种通过计算机技术对图像或视频进行分析和理解的方法。这种算法能够将图像中的特征和模式与已知

2024年02月11日
浏览(34)
基于OpenCV的自动报靶识别实验

户外胸环靶自动报靶问题，目前是通过声电等方式来识别，成本较高，本文尝试使用图像处理的方法来识别。前提：固定相机确定靶子的四个顶点：目前使用人工手动标注，暂不考虑自动，这步尤为关键直接影响后续弹孔位置确定提取靶子：透视变换寻找最新的弹孔：a)优

2024年02月08日
浏览(114)
自动化测试识别验证码方法

在进行自动化测试，我发现很多人卡在验证码无法是识别的路上，往往都是需要开发提供万能码或者取消验证码，但是有的时候需要真实场景模拟，验证码的获取就比较困难，今天分享一个自己亲测的UI自动化测试登陆时验证码输入的有效简单的解决方法。首先我采用的是

2024年02月13日
浏览(47)
教你如何使用pr语音自动生成字幕，pr自动识别声音添加字幕

说到pr语音自动生成字幕，还是需要的用到Speech to Text for Premiere Pro 2022插件，这是一个pr语音自动生成字幕插件，可以自动生成序列的脚本并为视频创建可自定义的字幕，而且支持13种语言，需要的可以试试。 1、下载好Speech to Text for Premiere Pro 2022插件解压包，然后安装 2、安装

2024年02月04日
浏览(55)