Hive:bigint和string进行join出现匹配错误问题

这篇具有很好参考价值的文章主要介绍了Hive:bigint和string进行join出现匹配错误问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

转载链接

在hive中,两个表进行join,on条件两表的字段含义一致(都是整数),但数据类型不一致:string和bigint。join后发现如果数值过大则匹配的记录会出现问题:一条记录会匹配出多条记录(explain可以发现都转换为double)

如:190000000002778025,就会错误的匹配上*8023 ,*8025

a)原因:Java中精度只有15至16位,当数据超过精度就会不准——也就会出现超过精度的记录join上许多不一致的记录。

bigint和string比较时会隐式地都转换成double,java中double的精度只有15-16位(double可以精确的表示小于2^52=4503599627370496的数字)。当数字超过精度的时候就会比较不准确,出现上面描述的现象。

b)解决方法:建议将string转换为bigint~ cast(c as bigint) 后再进行比较。

float 和 double 的区别:double更占内容,在满足需求的基础上,使用float更合理。文章来源地址https://www.toymoban.com/news/detail-854367.html

到了这里,关于Hive:bigint和string进行join出现匹配错误问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • jsp页面出现“String cannot be resolved to a type”错误解决办法

    篇首语:小编为大家整理,主要介绍了jsp页面出现“String cannot be resolved to a type”错误解决办法相关的知识,希望对你有一定的参考价值。 解决办法:    右键项目名→Properties→​​Java ​​Build Path→Libraries→选中JRE System Library[Sun JDK 1.8.0_102]→Edit→选中“Workspace default JR

    2024年02月09日
    浏览(39)
  • HIVE 3 使用 MR 引擎多表关联 (JOIN) 导致丢数的问题复现、问题根源及解决方案 (附代码)

    本文意图解决 HIVE 3 版本中使用 MR 作为运算引擎进行 JOIN 操作时导致的丢数情况。 Apache Hive 在 2.3 版本后宣布放弃维护 MapReduce 作为底层执行引擎,并转而使用 Tez 作为默认的查询引擎。但是由于 Tez 在大作业量和高并发时的严重性能问题,导致许多任务不得不继续使用 MapRe

    2024年02月13日
    浏览(36)
  • 微信小程序编译每次都出现[ project.config.json 文件内容错误] project.config.json: libVersion 字段需为 string

    在 manifest.json中加入以下代码 具体配置可以参考小程序文档  根本原因是当前用的开发工具版本 非稳定版 。 ​​​​​​ 使用 开发工具的 稳定版本,不会触发此问题。  微信开发者工具——检查更新。千万不要手贱打钩,会更新到预发布版本,因为他最新。   附:开发工

    2024年02月04日
    浏览(44)
  • python中出现could not convert string to float:的问题

    GREENBIRD的个人絮絮念 可能情况 列表中并非纯数字,混杂着字母,当你定义一个np.zeros用于存储这个列表时报错 改成以下解决问题 2.读取文本数据中出现回车换行,导致出现[\\\' \\\']行,存入np.zeros所定义的矩阵报错 listFromLine[0:4]输出如下,因为有空格的缘故,导致数组returnMat中的

    2024年02月11日
    浏览(44)
  • 【Java】String.join()方法

    String.join() 方法返回使用指定分隔符拼接一个字符串。 在join() 方法中,为每个元素添加了分隔符。如果为null元素,则添加“null”。 从JDK 1.8开始,Java字符串才包含join() 方法。 delimiter :每个元素要添加的分隔符 elements :需要添加分隔符的字符串(表示被连接的数组(也可以

    2024年02月10日
    浏览(38)
  • 【Uni-App】微信小程序编译每次都出现[ project.config.json 文件内容错误] project.config.json: libVersion 字段需为 string

    当前用的开发工具版本不是 稳定版 根据微信小程序文档内容进行配置。 值 说明 latest 最新的非灰度中的基础库 trial 最新的基础库 widelyUsed 使用比例最高的基础库 在 manifest.json中加入 重启项目即可 根据自己需要,关闭 微信开发者工具 的 自动更新最新版本 功能 通过点击菜

    2024年02月21日
    浏览(45)
  • 【hive】简单介绍hive的几种join

    common join 主要是针对数据/业务逻辑的join。 Map join , Bucket Map Join , SMB Map Join , Skew Join 是hive 针对特殊数据、场景 进行的优化。 Left Semi Join 则是 Sql 语句的优化,并且也可以应用上面的优化方案。 如果不指定MapJoin或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Comm

    2024年02月12日
    浏览(38)
  • 电脑无故出现无法拨号,提示720错误的问题

    您的电脑是否有遇到电脑无故出现无法拨号,提示720错误的问题,如果有出现的,请查看是否以下现象: 到设备管理器中的网络适配器查看设备,是否以下三个设备是叹号状态 wan微型端口(ip)、wan微型端口(ipv6)、wan微型端口(网络监视器). 您可以通过以下方法手工解决

    2024年02月06日
    浏览(92)
  • 解决Win10出现找不到api-ms-win-crt-string-l1-1-0.dll问题

    其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题,如果是新手第一时间会认为是软件或游戏出错了,其实并不是这样,其主要原因就是你电脑系统的该dll文件丢失了或者损坏了,这时你只需下载这个api-ms-win-crt-string-l1-1-0.dll文件进行安装(前提是找到适合的版本

    2024年02月05日
    浏览(67)
  • Hive(27): join连接查询

    1 join概念回顾 根据数据库的三范式设计要求和日常工作习惯来说,我们通常不会设计一张大表把所有类型的数据都放在一起,而是不同类型的数据设计不同的表存储。比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单

    2024年02月15日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包