由买买提看人间百态

topics

全部话题 - 话题: 机器翻译
首页 上页 1 2 3 4 5 6 7 8 (共8页)
s*****w
发帖数: 1527
1
NLTK好像不怎样,
对于商业公司,用google不是长久之计。
w***g
发帖数: 5958
2
NLTK是上一代技术. 有了deep learning后应该已经洗牌了.
虽然算法和代码有不少公开的, 但是没有训练数据没法弄啊.
这里面水很深. 如果楼主是要做生意, 强烈不建议折腾开源
系统. 如果你的business model依赖NLP作为IP, 或者用了
收费API就没有盈利了, 那么我觉得很值得担心. 用API根本
没问题. 就是我的客户, 有API的我也建议他们去用API.
API处理一张图片收几分钱. 让我开发一个模型, 算成本得
成千上万.
如果是自己做着玩, 现在倒是碰上好时代了.
https://github.com/opennmt/opennmt
https://github.com/tensorflow/nmt
能玩各种NLP的花样.就是中英文翻译的训练数据不好找啊.
应该是你给我发的微信吧, 电脑上敲字容易就多敲一点.
c*********e
发帖数: 16335
3
试试翻译几个简单的中文到英文:
我打败了 --> google translate:
I defeated
我被打败了 --> google translate:
I was defeated
s*****w
发帖数: 1527
4
如果用rest API,那么我这里的客户信息会送往remote server, 违反data privacy.
w***g
发帖数: 5958
5
这就尴尬了. 我估计翻译的model如果去license的话不会便宜.
A*****s
发帖数: 76
6
在上世纪60-70年代,加拿大神经生理学专家DavidHubel(1926-2013) 与瑞典生理学
家TorstenWiesel (1924-)紧密合作,以实验为基础,搞清楚了大脑视觉系统对外界
刺激信号的反应机制,证明了大脑神经皮层的多层次结构,奠定了现代人工智能的仿生
学基础,为此,荣获1981年度诺贝尔医学奖。
2006年,加拿大人工智能专家GeoffreyHinton在《科学》期刊上发表署名文章,指
出:深度神经网络(DNN)在系统训练上的难度,可以通过“逐层初始化”(Layer-
wisePre-training)来有效克服,从此。开启了深度神经网络(DNN,又叫“深度学习
”)的研究与应用的世界浪潮。
实际上,深度学习(DeepLearning)就是现代人工智能的核心技术。谷歌、微软与
百度是现代人工智能领域的“三巨头”。它们拥有海量数据以及DNN技术,比如:2012
年11月,微软(中国)在天津的一次会议上公开演示了一个全自动的“同声传译”系统
,讲演者用英文演讲,后台的计算机一气呵成,完成语音识别、英中机器翻译,以及中
文语音合成,效果非常流畅。微软使... 阅读全帖
j****w
发帖数: 53
7

。。。。。。。
r****e
发帖数: 3109
8
oh my, i was asked this question during one of my job interviews.
j****w
发帖数: 53
9
what did you say?
N****n
发帖数: 106
10
请问你这个广告现在还有效吗?本人现在就在做汉英机器翻译的项目,不介意业余赚点
零花钱。若你的广告还有效,我毛遂自荐接你的活儿。
N****n
发帖数: 106
11
请问你这个广告现在还有效吗?本人现在就在做汉英机器翻译的项目,不介意业余赚点
零花钱。若你的广告还有效,我毛遂自荐接你的活儿。
r******n
发帖数: 4522
12
来自主题: Astronomy版 - 人类真的止步了
机器翻译的吧,我怎么读得磕磕绊绊地,还不如看英文的。
D****g
发帖数: 275
13
来自主题: Biology版 - unidentified_title
这是机器翻译的吧?Just curious.
Q***5
发帖数: 994
14
许多应用,比如视觉识别,比如语音识别/机器翻译(虽然现在还不完善),包括最近
计算机下围棋等等,都是机器学习的具体应用。
g******e
发帖数: 492
15
来自主题: Science版 - 人是如何辞世的
没想到现在科技已经进步到这种程度了,可以通过测量脑电波并翻译成文字,前今
天还与别人争论自然语言是不是永远不可能用机器翻译呢。
设想一下,以后可以通过脑电波直接相互交流,而且还能进行远距离通信,如果携
带CDMA的通信设备,简直可以取消电话了。跟STARTREK里的BORG差不多了。
嘻嘻?
a***g
发帖数: 2761
16
来自主题: Statistics版 - Text-mining 紅樓夢 - update(1)
比较虚词这是老梗了
像现在汉语在网上出现的情况是很多词或者词组都是同音的别字只要顺序正确就不影响
表达
虽然英语也有很多缩写和谐音,但是还算是成块的,比较起来真是减少了很多麻烦
前一阵和在多伦多的同学聊天还提起来那边有做mcmc的介入了一些这方面的工作,不过
就是瞎侃,也没见过文章
另外不知道这个现在汉语的机器翻译做到什么程度了
c**********u
发帖数: 7276
17
你也别瞎猜了,你要不是这次行为艺术封我,根本都不认识你。俺之前的一次上买买提
,szbd还是菌斑斑竹。只是看你蹦得欢,对你所有的文章,尤其你行使权利封人的文章
,以及别人对你投诉的文章稍微进行了一下分析,就很容易得出你啥德行。你接着封了
俺14天,不仅对你有好奇了一些,所以采用了进一步的data mining和cluster
analysis(就是分析你谈话的主题,周围人的情况得出的分类统计)得出下面的一些结
论(当然能准确定位你信息的部分,就不列在这,你感兴趣,可以私信讨论)。
你来自南京,北京读的书,2001年来美一直在University of British Columbia。中间
换过若干地方。本来对加拿大不了解,奶奶的,现在俺对Vancouver也有了一些印象。
很奇迹,你在那个地方居然一直待到现在。你兴趣广泛,富有一定同情心(说明你不是
一开始就行为艺术的),喜欢搞电脑,对电子商务,机器翻译和网站建设尤其感兴趣。
同时对自然科学,生命起源甚至天文也有点兴趣,佩服佩服。当然有的分析结果概率能
达到98%, 有的只能达到82%。不过基本应该准确的。
研究表明,你应该是2010... 阅读全帖
l*****e
发帖数: 416
18
据说是通过机器翻译mitbbs上刊登的新闻,来了解中国动态。本站真是繁荣昌盛啊,赞
一个。
e**i
发帖数: 1983
19
楼主的帖子旁证了我的如下帖子。
所以,mitbbs当然应为之自豪!
但“With great power, comes great responsibility!”,所以,你们站方也是任重而道远!
︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵︵
http://www.mitbbs.com/article3/Military/37479237_0_tn.html
发信人: erli (政治白痴学研中←位卑未敢忘忧国), 信区: Military
标 题: mitbbs军版是当前舆论的各方势力必争之地——Re: 建议对那些已经证明曾
经散布谣言的ID
发信站: BBS 未名空间站 (Thu Mar 22 10:37:13 2012, 美东)
你这样想是因为你本人没见识……
mitbbs可说是北美(甚至可能是整个海外)论坛平均智识最高的人群集中地……凡出国
(尤其国内名校全奖出国一类)没有不知道mitbbs的,几乎所有人都会时不时上来查看
信息——许多人只看不发言(要么没时间要么没兴趣),但这些都是各方势力要争取的
民意,都是海外华人中的精华……这也是为什么mit... 阅读全帖
l*******s
发帖数: 1258
20
来自主题: Medicalpractice版 - 汉化 CMG Physician Database ?
医学类的机器翻译 不错 有点意思 !
搞NLP的路过。。。
l*******s
发帖数: 1258
21
来自主题: Medicalpractice版 - 汉化 CMG Physician Database ?
natural language processing,机器翻译是NLP的一个分支。
关于这个应用,不妨考虑下systran等产品
I***i
发帖数: 14557
22
http://www.theguardian.com/environment/2015/sep/28/worlds-small
http://www.treehugger.com/animals/worlds-smallest-snail-discove
他又说……并且蜗牛的生存需要最少数量的细胞。(肯定是机器翻译的)
……and a minimum number of cells are needed for the animal to exist, he
added.
l******n
发帖数: 9344
23
来自主题: DataSciences版 - text mining中的relation extraction
这个是机器翻译的基础,应该有比较成熟的算法了
l******0
发帖数: 244
24
来自主题: DataSciences版 - text mining中的relation extraction
以前的机器翻译是这样做的,分析语法和语义,但现在主流的都是直接使用统计的方法
,使用大量的翻译例句进行学习,并没有对语言本身进行深层分析,因为那样很困难。
g*****o
发帖数: 812
25
来自主题: DataSciences版 - text mining中的relation extraction
所以现在机器翻译是不管句法标志的么? 我还以为至少会把同一个词的不同句法标志,
当做几个词来看待.
m***r
发帖数: 359
26
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-09
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-09/short.html
1) 【孟凡东CNN用于机器翻译】 by @鲁东东胖
关键词:深度学习, 算法, 资源, PDF, 论文, 神经网络
#DL4NLP @Noah # 第一弹: 介绍下 @孟凡东_ICTNLP 的出色工作 ( [1] ),我们把
来自target的attention signal加入source encoding CNN的输入,得到了比BBN的模型
好的多neural network joint model (一个点的BLEU值提升), 这是和计算所 @刘群MT-
to-Death 老师的合作项目的初期工作的一部分
[1] http://arxiv.org/pdf/1503.01838v1.pdf
2) 【文本挖掘揭开印度菜的美味秘诀】 by @爱可可-... 阅读全帖
m***r
发帖数: 359
27
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-12
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-12/short.html
1) 【中英文维基百科语料上的Word2Vec实验】 by @52nlp
关键词:自然语言处理, 主题模型
中英文维基百科语料上的Word2Vec实验: 最近利用gensim word2vec模块在中英文维基
百科语料上分别测试了一下word2vec,记录一下实验的过程,欢迎观摩 [1]
[1] http://www.52nlp.cn/?p=8198
2) 【extreme learning machines】 by @黄广斌-ELM
关键词:算法, 资源, PDF, 教育网站, 神经网络
ELM的主要目的是使机器学习同时达到高准确度,较少的人工干预和实时学习。和过去
几十年传统的神经网络算法和理论信条相反,ELM理论显示隐层节点很重要但许多种神
经网... 阅读全帖
m***r
发帖数: 359
28
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-18
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-18/short.html
1) 【WSDM 2015总结】 by @唐杰THU
关键词:会议活动, 资源, 自然语言处理, Michael Franklin, PDF, WSDM, 会议
WSDM 2015结束,推荐大家一个黄老师等人领衔写的总结。 [1] 今年我们做了论文评审
的A/B test (分给不同组评审),录用率仅16%。邀请了加州伯克利的Michael Franklin
,Facebook的Lada,康奈尔的Thorsten等人做keynote。今年还有winter school,很是
卖座,还用了 @刘知远THU 的关键词抽取
[1] http://www.ccf.org.cn/resources/1190201776262/2015/03/12/16.pdf
... 阅读全帖
m***r
发帖数: 359
29
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-09
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-09/short.html
1) 【孟凡东CNN用于机器翻译】 by @鲁东东胖
关键词:深度学习, 算法, 资源, PDF, 论文, 神经网络
#DL4NLP @Noah # 第一弹: 介绍下 @孟凡东_ICTNLP 的出色工作 ( [1] ),我们把
来自target的attention signal加入source encoding CNN的输入,得到了比BBN的模型
好的多neural network joint model (一个点的BLEU值提升), 这是和计算所 @刘群MT-
to-Death 老师的合作项目的初期工作的一部分
[1] http://arxiv.org/pdf/1503.01838v1.pdf
2) 【文本挖掘揭开印度菜的美味秘诀】 by @爱可可-... 阅读全帖
m***r
发帖数: 359
30
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-12
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-12/short.html
1) 【中英文维基百科语料上的Word2Vec实验】 by @52nlp
关键词:自然语言处理, 主题模型
中英文维基百科语料上的Word2Vec实验: 最近利用gensim word2vec模块在中英文维基
百科语料上分别测试了一下word2vec,记录一下实验的过程,欢迎观摩 [1]
[1] http://www.52nlp.cn/?p=8198
2) 【extreme learning machines】 by @黄广斌-ELM
关键词:算法, 资源, PDF, 教育网站, 神经网络
ELM的主要目的是使机器学习同时达到高准确度,较少的人工干预和实时学习。和过去
几十年传统的神经网络算法和理论信条相反,ELM理论显示隐层节点很重要但许多种神
经网... 阅读全帖
m***r
发帖数: 359
31
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-18
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-18/short.html
1) 【WSDM 2015总结】 by @唐杰THU
关键词:会议活动, 资源, 自然语言处理, Michael Franklin, PDF, WSDM, 会议
WSDM 2015结束,推荐大家一个黄老师等人领衔写的总结。 [1] 今年我们做了论文评审
的A/B test (分给不同组评审),录用率仅16%。邀请了加州伯克利的Michael Franklin
,Facebook的Lada,康奈尔的Thorsten等人做keynote。今年还有winter school,很是
卖座,还用了 @刘知远THU 的关键词抽取
[1] http://www.ccf.org.cn/resources/1190201776262/2015/03/12/16.pdf
... 阅读全帖
m***r
发帖数: 359
32
来自主题: DataSciences版 - 机器学习周报 2015-03-15
http://ml.memect.com/weekly/2015-03-15/
## 2015-03-15 星期日,完整版 28 条
NICAR15主题报告Hands-on with machine learning @爱可可-爱生活
《七周七并发模型》 @睡眼惺忪的小叶先森
两个R语言教程 @2gua
经典老文Fast unfolding of communities in large networks @爱可可-爱生活
用PageRank计算世界杯参赛球队排行榜 @爱可可-爱生活
## 2015-03-14 星期六,完整版 28 条
LINE模型大规模网络降维公布论文以及源代码 @chuckpku
概率图模型基础总结 @数盟社区
Sum-Product Networks @爱可可-爱生活
IJCV 综述:图模型中的离散能量最小化 @赵家平USC
Stanford基于神经网络的自然语言依存关系解析器 @爱可可-爱生活
## 2015-03-13 星期五,完整版 32 条
多智能自然语言处理 @刘知远THU
计算机辅助翻译推荐作者 @青鸟leo翻译之声
FaceNet人脸识别 @爱可可... 阅读全帖
e**o
发帖数: 5509
33
来自主题: _voip版 - 谁能给个asterisk的教程啊
这个好像是这本书的中译本,也像机器翻译的,作参考吧。
http://www.cn-cti.com/wp-content/uploads/2009/01/asteriske69687
A*****s
发帖数: 13748
34
来自主题: _DC版 - google翻译
好象是如果你看见了个很白痴的机器翻译,然后你suggest,然后他就take
但是如果你是第二个suggestion,就不那么容易了
x******n
发帖数: 9057
35
也可能是机器翻译忘了改了。。
c******a
发帖数: 168
36
罗永浩的野心倒是不小。他办多国语言版,难道牛博上五花八门的写手们随便每日几篇
博,都要找人翻译成多国语言?或者用机器翻译?他真觉得外国人关心中国到这种地步
了?
首页 上页 1 2 3 4 5 6 7 8 (共8页)