boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 如何从代码里向yarn动态提交一个spark job
相关主题
多大的项目可以考虑microservice?
Spark + C*
请教peking2等ms->open source大神一个问题
如果没有api,有什么办法写网站客户端呢?
有谁玩过C* + Spark?
关于 SPARK, 问二爷peking2 和其他大牛一问题
docker的newbie 问题
如何提高Spark在Yarn上的内存使用率
通过日志分析yarn app实际内存用量
Hadoop 和Python的数据分析包哪个更值得学习?
相关话题的讨论汇总
话题: spark话题: job话题: 提交话题: shell话题: script
进入Programming版参与讨论
1 (共1页)
c*****a
发帖数: 1638
1
研究了几天,好像无解?
貌似所有的地方都是说只能用spark-submit那个script,但是这个简直是搞笑吧
如果我有个web application,要根据具体情况提交spark job,难道必须从shell调用
这个spark-submit?
这么基础的功能都没有?或者说这么基础的API都不expose,spark这帮人在干啥啊?
在production里面,难道大家都是直接用这个shell来提交job?
n*****3
发帖数: 1584
2
我看到的git hub 例子, 好像都是 spark summit from the shell
我是在local machine generate the jar file, then ftp it to the cluster
to run with spark-summit
不知道有什么省事的procedure

【在 c*****a 的大作中提到】
: 研究了几天,好像无解?
: 貌似所有的地方都是说只能用spark-submit那个script,但是这个简直是搞笑吧
: 如果我有个web application,要根据具体情况提交spark job,难道必须从shell调用
: 这个spark-submit?
: 这么基础的功能都没有?或者说这么基础的API都不expose,spark这帮人在干啥啊?
: 在production里面,难道大家都是直接用这个shell来提交job?

c******f
发帖数: 243
3
ooyala好像有个restful api神马东西
我们这是upload file然后shell script运行的
c*****a
发帖数: 1638
4
难道真的只有这么2的方法啊
这帮学院派的人搞软件开发usability就是不太靠谱。
如果没办法,只好暂时先这么着。
关键是我要用EMR的API提交,那么只能在java的main里面再提交shell了。

【在 c******f 的大作中提到】
: ooyala好像有个restful api神马东西
: 我们这是upload file然后shell script运行的

n*****3
发帖数: 1584
5
去了spark summit, 感觉这帮 人是 acdemical guys,那个 spark streaming
是一个一年级的 phd student lead。。。。 呵呵 只能说 自古英雄出骚年

【在 c*****a 的大作中提到】
: 难道真的只有这么2的方法啊
: 这帮学院派的人搞软件开发usability就是不太靠谱。
: 如果没办法,只好暂时先这么着。
: 关键是我要用EMR的API提交,那么只能在java的main里面再提交shell了。

B*****g
发帖数: 34098
6
ding

【在 n*****3 的大作中提到】
: 去了spark summit, 感觉这帮 人是 acdemical guys,那个 spark streaming
: 是一个一年级的 phd student lead。。。。 呵呵 只能说 自古英雄出骚年

p*****2
发帖数: 21240
7
standalone应该可以吧?

【在 c*****a 的大作中提到】
: 研究了几天,好像无解?
: 貌似所有的地方都是说只能用spark-submit那个script,但是这个简直是搞笑吧
: 如果我有个web application,要根据具体情况提交spark job,难道必须从shell调用
: 这个spark-submit?
: 这么基础的功能都没有?或者说这么基础的API都不expose,spark这帮人在干啥啊?
: 在production里面,难道大家都是直接用这个shell来提交job?

c******f
发帖数: 243
8
我们是写了个EMR step(java)把jar file /bash script上传到master, 再写个step
叫execute script
之前我们是全部bash的,用aws cli tool做的

【在 c*****a 的大作中提到】
: 难道真的只有这么2的方法啊
: 这帮学院派的人搞软件开发usability就是不太靠谱。
: 如果没办法,只好暂时先这么着。
: 关键是我要用EMR的API提交,那么只能在java的main里面再提交shell了。

c*****a
发帖数: 1638
9
这个shell script不能执行在s3上面的jar,对吧...
这个还要下到本地...
挺麻烦的。
这个usability真要命。虽然这个spark的框架设计真的是不错。

step

【在 c******f 的大作中提到】
: 我们是写了个EMR step(java)把jar file /bash script上传到master, 再写个step
: 叫execute script
: 之前我们是全部bash的,用aws cli tool做的

M***r
发帖数: 79
n*****3
发帖数: 1584
11
你觉得好用吗?

jobserver

【在 M***r 的大作中提到】
: Try ooyala's Job server: https://github.com/spark-jobserver/spark-jobserver
1 (共1页)
进入Programming版参与讨论
相关主题
Hadoop 和Python的数据分析包哪个更值得学习?
Yarn的设计根本就是错的
感觉flink出来之后,hadoop就显得不怎么再需要了
搞不懂为什么大牛说Hbase不如C*?
怎样schedule spark application
我对AWS 基本的services
hbase的问题
《移植应用程序到IPv6》英文文字版[PDF]
Scala会不会把Java搞成第二个C++
我要做一个Java演示系统,用哪些前台技术比较好?
相关话题的讨论汇总
话题: spark话题: job话题: 提交话题: shell话题: script