博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
UDF打成jar包并添加为Hive的自定义函数
阅读量:4299 次
发布时间:2019-05-27

本文共 701 字,大约阅读时间需要 2 分钟。

好文章参考:,写的很详细。

 

废话不多数,具体步骤

1. 先把java项目转化一下成maven项目

(1)在项目上右击, 选择 configure ->Convert to maven project 此命令把该项目转换成 maven 项目 

(2)然后在项目右击, run as 选项里就有 maven install 菜单了

(从git上下载下来之后  作为普通项目了,需要转换成maven项目)

2.然后测试一下,可以选择mvn test,先把例子跑过了。

3. 第三步对着项目右键,mvn install,顺利的话会在项目目录下的target目录下生成jar包

4.把jar包放到hdfs的一个目录下   hdfs dfs -put   xxx.jar   /xxx/xxx

5. beeline模式下创建函数,语法如下:

 jdbc:hive2://localhost:10000/default>  create function hahaha as 'com.datafibers.hiveudf.udf.StringLower' using jar 'hdfs:///apps/hive/function/df-hiveudf-1.0-SNAPSHOT.jar';

6. 这里一直有个bug

-- 此处有一个BUG,show functions  hahaha

无法看到该函数 -- 但是可以直接使用 -- 如果重新在default数据库中(我beeline连接时直接连接了default数据库)创建同名函数,则会报错函数已存在。

7. ok了,可以运行hahaha函数了。发现确实把大写字母都变成了小写字母。

转载地址:http://wuvws.baihongyu.com/

你可能感兴趣的文章
从零开始到设计Python+Selenium自动化测试框架-如何开始
查看>>
Python+Selenium基础篇之2-打开和关闭火狐浏览器
查看>>
Python+Selenium基础篇之3-打开和关闭IE/Chrome浏览器
查看>>
Python+Selenium基础篇之4-XPath的使用
查看>>
Python+Selenium基础篇之5-第一个完整的自动化测试脚本
查看>>
Python+Selenium练习篇之8-利用css定位元素
查看>>
Python+Selenium练习篇之19-断言页面标题
查看>>
Python+Selenium练习篇之20-获取元素上面的文字
查看>>
Python+Selenium练习篇之21-验证控件是否被选中
查看>>
Python+Selenium练习篇之22-获取页面元素大小
查看>>
Python+Selenium练习篇之23-组合键-全选文字
查看>>
Python+Selenium练习篇之24-组合键-退格键删除文字
查看>>
Python+Selenium练习篇之25-鼠标右键
查看>>
Python+Selenium练习篇之26-执行JavaScript
查看>>
Jenkins高级篇之Pipeline实践篇-5-Selenium和Jenkins持续集成-Pipelinejob草稿版
查看>>
Jenkins高级篇之Pipeline实践篇-6-Selenium和Jenkins持续集成-pipeline参数化构建selenium自动化测试
查看>>
Jenkins高级篇之Pipeline实践篇-7-Selenium和Jenkins持续集成-publish html report插件的pipeline使用介绍
查看>>
Jenkins高级篇之Pipeline实践篇-8-Selenium和Jenkins持续集成-添加事后删除报告功能和解决报告名称硬编码
查看>>
Jenkins高级篇之Pipeline实践篇-9-Selenium和Jenkins持续集成-日志文件归档和插件rebuild介绍--完结篇
查看>>
Java多线程-48-单例设计模式
查看>>