由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 请教 用Hive 算TF-IDF
相关主题
[Data Science Project Case] Topic Learning你们用的都是pig吗?
征集版标初入data science的困惑
现在的大数据技术的价值和功用有些被夸大了如何学习Hadoop?
请问如何用JDBC连接R和Hive (转载)求助: 一个用Hive提取feature的问题
三星samsung创新部门招大数据工程师 (转载)hive table 转换成csv文件丢数据是什么情况?
Impala v HiveRe: MapR Technologies continue hiring a lot of positions (转载)
请问大家有没有直接用java全程写mapreduce的程序的?data scientist的五个方面
big set intersection in pig贴个工作
相关话题的讨论汇总
话题: tf话题: hive话题: idf
进入DataSciences版参与讨论
1 (共1页)
b***v
发帖数: 5
1
网上有篇文章
https://github.com/myui/hivemall/wiki/TFIDF-calculation
但是其中有一段不明
-- set the total number of documents
select count(distinct docid) from wikipage;
set hivevar:n_docs=3;
个人理解n_docs应该是total number of docs,亦即上一行的输出结果才对。
但是如何才能定义一个变量并对其进行初始化(用query所得的结果)?
1 (共1页)
进入DataSciences版参与讨论
相关主题
贴个工作三星samsung创新部门招大数据工程师 (转载)
data scientist positionImpala v Hive
求Google 的 Data Science 有关的位置内推 (转载)请问大家有没有直接用java全程写mapreduce的程序的?
data scientist对sql要求高吗big set intersection in pig
[Data Science Project Case] Topic Learning你们用的都是pig吗?
征集版标初入data science的困惑
现在的大数据技术的价值和功用有些被夸大了如何学习Hadoop?
请问如何用JDBC连接R和Hive (转载)求助: 一个用Hive提取feature的问题
相关话题的讨论汇总
话题: tf话题: hive话题: idf