发帖数: 1 | 1 最近在team match, 前几个hr给的都是办公四件套的组我并不是很感兴趣。 后来我说
dataflow看起来还不错,hr给联系了dataprep组(因为dataflow不在湾区),这个组非
常新还在BETA阶段。电话和HM还有Tech Lead(年底刚升的T5...)聊了一下,感觉这个组
主要是做Trifacta和GCP的integration,并不涉及data processing infra的活。 而且
听HM的意思过去一年主要就是tech lead一个人写的dataprep的code(估计因为这个升的
T5),二人说是有很多东西要做不过时间比较短没来得及深聊,谈的都非常笼统。
请问坛子内的大神们有没有稍微了解这个Dataprep的?能给点建议感激不尽。 我主要
顾虑是有以下几点:
1. team太小,tech lead才刚升的T5,担心过去没有高人带。我是T4.
2. HM和LEAD都在西雅图,湾区这边因为离Trifacta近,所以新职位都在湾区。这样的
话就跟HM和LEAD距离甚远
3. 组里做的主要是integration,具体细节还有待约第二次电话详聊。我个人对这个领... 阅读全帖 |
|
d********w 发帖数: 363 | 2 这里面创业公司太多了,包含BI工具,数据存储和挖掘,应用等,我就简单说一些我感
兴趣的,其他的可以参考。
Palantir:超过百亿美金估值,已经是超级独角兽,就单独列出来。Peter Thiel创办
大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,
并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL: 号称最快的内存数据库。
GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB: 分布式文件存储的数据库
DataStax:主力开发Cassandra。
Hadoop
Altiscale: 提供的Hadoop作为一种服务(HAAS)
Qubole:Hadoop服务提供商,Pinterest也是它的客户
Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP
和OLAP 应用进行实时优化处理
机器学习
Paxata:应用机器学习技术处理大数据难题
0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测
Everstrin... 阅读全帖 |
|
x*****n 发帖数: 195 | 3 看业务简介是paxata/trifacta + tableau/qlik。palantir比这几个公司在数据分析上
挖得深多了。 |
|
|