s******a 发帖数: 184 | 1 公司准备考虑一个hadoop 的应用, 但现在已有基于SAP 的系统, 和基于 Microsoft
SQL 的系统, 一些 顾问公司提出的建议是把所有SAP和 microsoft SQL 里的data全
load 到 HAHDOOP去。 但管理SAP和Microsoft SQL的 组都不愿意这么做。我也觉得这
不是一个正确的做法。 现在有什么成熟的架构能够只在需要的时候读取 SAP和
microsoft SQL里的data, 而不是在Hadoop上再做一套数据的备份。或者说有什么data
federation layer 的设计能够让hadoop 的 application layer 自由调度存在那些里
的data |
D**u 发帖数: 288 | 2 Hadoop仅作为application layer不是很make sense。我不怎么了解详细情况,但顾问
公司的提议是合理的,hadoop的application layer最好还是读取hdfs上的数据。 |
z****e 发帖数: 54598 | 3
的确
不是所有的logic都是mr那么简单和纯粹的
【在 D**u 的大作中提到】 : Hadoop仅作为application layer不是很make sense。我不怎么了解详细情况,但顾问 : 公司的提议是合理的,hadoop的application layer最好还是读取hdfs上的数据。
|
w*r 发帖数: 2421 | 4 Did u check Apache presto ? |
b*****l 发帖数: 114 | 5 sap在db层的表直接读有不少风险 一般是做个中间层用bapi或者bods拿数据
你的说法很奇怪 难道只读legacy data么? 不做delta同步的?
直接从hadoop读sap也不现实。sap效率慢到家 你会拖垮系统的
mssql里的话 好弄点 他底层工具多 直接odbc加tsql也能凑合 |
b*****l 发帖数: 114 | 6 给你个文档
https://hortonworks.com/wp-content/uploads/2013/09/CIO.Guide_.How_.to_.Use_.
Hadoop.with_.Your_.SAP_.Software.Landscape.pdf
里面 sybase esp是广告 其他部分都靠谱 |