c******l 发帖数: 495 | 1 本质上还是特征提取然后做indexing。这些特征有可能是完全implicit的,比如用机器
学习分类出来的。
你不会觉得在数组里做搜索也是一个一个的对比吧?
Programming |
|
s******e 发帖数: 2181 | 2 这一期国际pk赛,我觉得比较有说头的是黄胜华那场。
黄的强项是观察特征和特征提取,这在他的两场入围赛里面,看包子和看套人都已经表
现地非常好。这个特长跟王昱桁、李威很像。国际pk赛的记牌不是黄的强项,考的是快
速记忆,这是王峰的专业但是他本期不在,德国选手刚破了他的纪录,所以就算王峰来
参加这场也未必能赢,所以这场基本是被舍弃的一场。
李威那一场,如果像素是随机产生的,我觉得只需记忆边上几个色块,足以用来map
100个数字编码。理论上,一个位置可能有6种颜色,那么只需记忆边角的三个色块 (6
*6*6)就足够对100个数字编码了。但考虑到有可能的重复,那么记忆5个色块,也足够
了吧我想,所以并没有想象的那么难要把整幅图记忆下来。 |
|
b********p 发帖数: 875 | 3 动词用错了
sift不是牛仔特征提取, 而是牛在特征描述
的? |
|
m********5 发帖数: 17667 | 4 这个涉及到特征提取和特征序列"语法"分析
比卡拉OK打分复杂一百倍 |
|
i******t 发帖数: 22541 | 5 假设我在做图片的 分类问题
假设识别猫
我的训练样本 只知道 此图是1 还是 -1
我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的
位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像,
也可能比较小 , 也可能多个猫
这样的 训练样本 如何搞特征呢?
谢谢讨论 |
|
L****8 发帖数: 3938 | 6 CNN的各种模板 从输入层开始
可以认为是 fixed length code data compression
连接好几层 就可以达到 压缩 再 压缩的效果
最后一层几个数的特征向量 就可以描述输入图片
如果用 variable length encoding 是不是 只需要很少几层 就可以完成特征提取?
比如说 zip文件 压了再压 基本没用
一个简单实现 就是 每一层 用不同大小的模板
另外 resnet 就是对应于差分编码方法 这样可以达到对细节的信息 不会丢失太多 |
|
r********n 发帖数: 7441 | 7 不够高清啊,火苗特征提取后可以卖给好莱坞做特技了 |
|
c*****t 发帖数: 10738 | 8 指纹特征提取很容易。对应成id难一点。laptop上面那个是verification, 不是
identification. |
|
|
f******9 发帖数: 267 | 10 世界首个“纯意念控制”人工神经康复机器人问世 6月14日,项目主要负责人天津大学
精仪学院教授明东(前左一)在指导因中风偏瘫的董姓患者使用系统用意念控制伸臂。
当日,“纯意念控制”人工神经康复机器人“神工一号”系统新闻发布会在天津市人民
医院举行。这一历时10年的技术,是国家“863计划”“十二五”国家科技支撑计划和
国家优秀青年科学基金重点支持项目,在复合想象动作信息解析与处理、异步脑—机接
口训练与识别、皮层—肌肉活动同步耦合优化、中风后抑郁脑电非线性特征提取与筛查
等关键技术上取得了重大突破,目前已拥有包括23项授权国家发明专利、1项软件著作
权在内的自主知识产权集群,是适用于全肢体中风康复的“纯意念控制”人工神经机器
人系统。
http://news.sohu.com/20140615/n400850749.shtml |
|
v*****a 发帖数: 1332 | 11 你看你看。。。
你至少去先了解一下应答机的模式。。。你以为是拿两个对讲机互相呼叫?
当然,其实我也不懂
都是本科老师上课讲段子当中听来的。有懂得麻烦指正啊。
应答机有多种模式
其中就有基于信号处理,特征提取,模糊匹配这一类的。
硬要说,还是ML的爷爷呢。。。 |
|
w***u 发帖数: 17713 | 12 现在的照片都是软件磨皮整形的,人人都是范冰冰,以后特征提取出来的都是垃圾数据
,garbage in garbage out. 图像处理得退出面部识别这个领域了。 |
|
h******k 发帖数: 15372 | 13 人都是稳拿,你琐男想不到的。陈进教授在2003年芯片事件事发之后的经历:
工作经历:
2004.12 – 2007.4 上海交通大学 机械与动力工程学院 机械系统与振动国家重点实验
室 教授/东京工业大学客座教授
2007.4 – 上海交通大学 图书馆馆长,机械与动力工程学院 教授/东京工业大学客座
教授
2003.10 - Mechanical System and Signal Processing
2007.11- 上海市高校图工委副主任、图书馆学会副会长、图书馆行业协会副理事长
科研项目:
2004.1 – 2006.12 国家自然科学基金重点项目:“大型复杂机电系统早期故障智能预
示的理论与技术(50335030)”,第三负责人
2005.1 – 2006.12 日本Fujitec公司国际合作项目:“振动测试环境、声源分析及电
梯定位系统开发”,负责人
2005.1 - 2006.1 产学合作项目:“贵州水城钢厂鼓风机状态监测与故障诊断系统开发
”,负责人
2006.1 - 2008.12 日本Fujitec公司国际合作项目:“噪声源的声全息辨识”,负责人
2007.1 – ... 阅读全帖 |
|
发帖数: 1 | 14 做过图像或者人脸识别技术的应该知道 当你把大量不同的人脸特征提取出来 然后综合
fusion 最后得出来的就是一个接近完美的 男人 或者女人容貌。 |
|
b******1 发帖数: 251 | 15
我觉得弃同学说得有道理,现在的神经网络构架设计就是为了找correlation的,所以
你不需要知道苹果是啥,斤是啥,而这样找出来的,也只能是correlations。
现在AI应用更多的其实在做特征提取与匹配,所以用在图像语音识别及数据分析优势
非常大,但是能否用于逻辑推理,就不晓得了。 |
|
m**********n 发帖数: 112 | 16 没有专门说是图像识别吧?machine learning的应用不局限于图像识别吧? |
|
L****8 发帖数: 3938 | 17 deep learning 主要领域就是图像语音文字 |
|
|
m**********n 发帖数: 112 | 19 不同领域面对的问题不一样。在很多工程领域,比如什么字体识别,文档识别之类的,
学术界的数据noise小,随便什么方法弄一弄,其实都差不太多。有的领域,比如金融
,情况就不太一样 |
|
m**********n 发帖数: 112 | 20 人工智能/machine learning 不等于deep learning |
|
m**********n 发帖数: 112 | 21 神经网络只是其中一个领域。 black box, 不是所有人都喜欢。
另外,现在学术界一般叫machine learning。 |
|
|
b****u 发帖数: 1130 | 23 你一看就是没在工业界干过。工业界一堆人实际把数据一拿,下个应用包跑一下,然后
画个图挺好看的,就可以向领导邀功了,反正领导也不懂,一看图漂亮,就说 well
done 了。 |
|
|
m**********n 发帖数: 112 | 25 给你说了,神经网络只是一个方向,
在某些领域好用,
但是不是什么地方都好使。 |
|
s*****V 发帖数: 21731 | 26 神经网络是狠人类思维方式很想象的东西,最近的这一波突破都是靠深度神经网络得来
的,别的那些领域不温不火的几十年了也没有看出有什么太大的前途。唯有神经网络,
拥有几乎无限的模拟能力,非常有前途实现真正的人工智能。 |
|
d********m 发帖数: 3662 | 27 分析数据再建立数学model是区分科班还是三脚猫的分水线。
做统计的习惯相对较好,看看数据比较适合用什么model fit。以前我认识一白哥们,
三脚猫非得搞什么protein network,人都是用power law fitting,丫什么都不懂出来
数据都用normal fitting,问他为什么,他说数据量大了什么都是normally
distributed。老子也是服了这种狗屁名校PHD了。 |
|
x****6 发帖数: 4339 | 28 任何学习方法,人脑也好,机器也好,能够学习的前提是 学习对象的复杂现象内部有
consistent的统计结构。
金融市场,股票期货价格没有这样的内部规律,什么学习方法也没有用,最终还是
garbage in, garbage out。
当让,像renaissance那样神一样存在的公司,据说是利用复杂的数学模型,找到一些
可靠的市场信号来交易,赚得盆满钵满。不过他们也不能公开那些信息,最后还是不确
定。 |
|
|
发帖数: 1 | 30 还是要先验数据,顶多算有监督学习,和吹的差得远。 |
|
m**********n 发帖数: 112 | 31 其他不好说,但是几乎敢肯定renaissance一定不是用什么复杂的数学模型挣钱的
而且这几年是不是挣钱都很难说 |
|
|
x****6 发帖数: 4339 | 33 但然,我就一打酱油看热闹的,不过好几个做物理和金融的朋友都是这么跟我说的。
具体怎么样,我不知道。
只是觉得AI现在有点过于神化。 |
|
x****6 发帖数: 4339 | 34 围棋这个例子比较特殊:游戏规则明确无误,不存在什么摸棱两可,隐藏信息。类似的
情况还有cellular automaton, game of life。
而人类面对的大多数实际问题,规则并不清楚,甚至是根据条件变化的,并且很多情况
并不知道,或者了解不全面。 |
|
b****s 发帖数: 872 | 35 围棋例子太无聊了。
工作里做四则运算比围棋技能还更有用,所以学校开数学课,不开围棋课。宣传电脑四
则运算能力强,没法骗人
不知道围棋用来解决什么问题 |
|
c****x 发帖数: 6601 | 36 真的不要被忽悠了。金融挣钱关键还是靠这三样:
A)影响整个工业的大新闻,B)公司自己内部的财务消息,和C)大投资人(如Mutual
Fund共同基金和Pension Fund养老基金)的大笔买卖。
http://newsblog.chinatimes.com/duduong/cn/archive/17252
------------------------------------------------------------
近年来,美国的金融交易逐步自动化,到目前已经有90%以上的交易是由电脑自动產生
。对股票有兴趣的读者或许会觉得奇怪,股票的估价是很复杂困难的,所谓的股票分析
师基本上100%都是自欺欺人的骗人把戏,电脑怎么能有那么高的智商来估出更精确的价
位来呢?其实推动股票价格涨跌的消息,可以分成三类:A)影响整个工业的大新闻,B
)公司自己内部的财务消息,和C)大投资人(如Mutual Fund共同基金和Pension Fund
养老基金)的大笔买卖。A项一般是很难操弄的,B项需要人为的非法内线交易,主要是
由康乃迪克州的几个对衝基金(Hedge Fund)来搞,电脑对这个... 阅读全帖 |
|
T*********s 发帖数: 20444 | 37 原标题:49岁男律师身中30多刀死在家中 警方排除他杀
现代快报讯 近日,常州当地网络传播着这样一条消息:大年初三(2月18日),金
坛一名男律师身中30多刀死在家中。2月26日,现代快报记者多方采访获悉,当地警方
介入调查后排除他杀。目前,经家属请求,当地警方已提请常州市公安局刑侦支队法医
进行复检。
△死者生前居住的小区△死者生前居住的小区
据了解,死者姓吴,今年49岁,是当地一家律师事务所的律师,生前居住在常州金
坛区某小区。2月26日下午,现代快报记者在现场看到,死者吴某某的住宅大门已贴上
金坛公安分局东城派出所的封条。
死者一位同事向现代快报记者透露,作为律所合伙人之一,吴某某已做了多年律师
,主要接手民事纠纷官司。“他为人比较温和,同事关系非常好,也没看出有什么异常
,过年放假前还好好的,没想到会这样。”该同事介绍说,现在所里也正在配合警方做
调查。
现代快报记者从权威部门获悉2月18日6时许,金坛分局110指挥中心接到王某某报
警,称其早上起床发现女婿吴某某在家割喉自杀,原因不详。
△事发现场已被警方贴上封条△事发现场已被警方贴上封条
接警后,该局刑警大队技术员和法医立即... 阅读全帖 |
|
发帖数: 1 | 38 他说的那个文章反证了PRRA是人工来的
插入PAA, 但是前面有一段也丢了,不整齐是自然突变的一大特征 |
|
s*********d 发帖数: 2406 | 39 面完Amazon,上来说说情况。我是投的时候是社会招聘的,但是不知道怎么就转到
University 去了。而且因为我有8个月的在某著名手机公司的intern 经验,没有任何
phone interview,
除了HR 打过电话联系介绍一些background,直接on-site了。
因为签了NDA,题目就不细说了。(要是不给我offer,就爆,LOL)
反正除了一道别的外都不是难题。
全部在Crack the code 那150题 里边。
另外的一道,属于machine learning的题目,跟我背景和他们team有关。
这个比较难,我结果没有想到优化的解决方案(NNS和K-D树)。
算是5轮面试+1轮 lunch+1轮轻松的HR chat
面了4个组,估计是对我的背景感兴趣的,
全部是是老白,没有老中和阿三。 人都非常nice
第一轮 小年轻,很Geek,做的是网页的特征提取部分。忘记组名字了。
也是唯一直接考了 Java的基本概念了。 这部分白板的时候,出了2个bug,他指出来了
,我也发现并且改正了。
第二轮 两个人,一个面,一个记。 payment security 组吧,... 阅读全帖 |
|
p*********m 发帖数: 619 | 40 具体题目就不透露了,毕竟签了协议的。
大概简述一下过程好了。
首先是HR联系,然后两轮phone interview, 一个是纯coding,一个是coding+
research相关的算法
然后onsite, 5个人,两个coding, 一个午饭(应该是考察behavior和
communication skill),一个research+算法,,最后是个manager, 考了一个design问
题。
coding就是跟版上差不多的类似的经典数据结构算法题,45分钟,平均每个人差不多考
三道,所以要求code要写得比较快。
research review好像只有phd申请人有,跟申请人个人的研究方向有关,所以没什么好
说的。不过有一个特点是,他们不光问你做过的项目,而且会出一个跟项目相关的问题
,要你差不多20分钟内设计算法并完成coding。
比较有特色的是facebook的design题。以前其他公司面试时遇过那种problem solving
的题,就是给一个问题,要求简述solution,一般用几分钟描述idea就可以了。
facebook这个design题45分钟,问你怎... 阅读全帖 |
|
d**e 发帖数: 6098 | 41 ☆─────────────────────────────────────☆
prettydream (wind) 于 (Sat Apr 14 07:39:40 2012, 美东) 提到:
个人基本背景是cs相关的PhD。
刚拿到了Facebook的offer,终于见到了网络上流传的20万$的package,原来是把base
, bonus, 每年的RSU折现,全加起来,这才接近传说中的20万$。
还有些一次性地签字费搬家费,几万刀
没见到版上前面帖子说的几万股甚至十几万股的RSU,估计是我没赶上趟,太迟了,或
者我太弱了,或者那只是传说。
福利方面确实还不错,
medical plan比我其他offer的强多了,基本干什么都是10$的copay那种
除法定假期外,每年有二十多天paid off vacation,这个很不错。
吃饭干洗什么的公司都免费提供。不过好像没有免费的公司day care, 这点不如
google。但是每年有几千美元day care的补贴。
生孩子公司送4000美元的cash。 领养送5000美元(领养反而多,这算是啥意思嘛?)
结论:工资福利确实都... 阅读全帖 |
|
d****n 发帖数: 12461 | 42 任何不为生产服务的人工智能都是纸老虎。
其实人工智能的startup大把大把的,看过几个做录像特征提取,机器人还有iot的都很
牛逼。当然这些真的是卖算法的,一般来说核心团队不会超过10个人,基本不招外面人
。研发模式也和研究新药有一拼。 |
|
z***y 发帖数: 7151 | 43 这个哥们是我的大学同学。 学图形处理的。 97年我骑自行车从城里骑到在乡下的他家
里, 我们俩在马路上捡马粪, 边捡边在讨论一个分形特征提取算法。 突然他停下来
, 很认真地对我说, 你看, 我敢说周围60里之内, 没有第三个人关心我们在讨论什
么! 我们边捡马粪边讨论这TM不着调的东西, 你不觉得很可乐?!
今天看到他的短信想起来了这件事。 15年白驹过隙, 但是好多片段一直忘不了。 |
|
f*******c 发帖数: 607 | 44 这两个人太快。好在油管有个功能慢放到一半或者四分之一,我觉得看慢放体会体会有
好处。做我这个专业的还有很多从视频当中做特征提取的工具。我周末放几个在服务器
上,您看看好不好使。 |
|
d*****l 发帖数: 8441 | 45 一个不懂中文的老外娶了中国老婆后还不懂中文发音,只好用类似“Ching Chong
Ching”的特征提取方法将中国地方戏曲中的语音元素(vocal element)给胡乱总结成
了“阿姨哟。。。阿姨哟。。。大個仔大個仔大個袋!!。。。”,然后给她老婆来扯鸡
巴唱。
至于她的另一首号称“独家”的《丢丢铜》根本就是闽南/台湾地方戏曲中的保留曲目
,至少邓丽君就唱过。 |
|
p*******r 发帖数: 475 | 46 想起来有人问Lowe,说每年这么多灌水搞特征提取的,你就不怕有人做出来超过SIFT的?
Lowe回答是,没事,他们搞的那些我全都搞过,效果都不如SIFT好。
一个 |
|
L****8 发帖数: 3938 | 47 图像 语音 文字
其他领域 不需要那么复杂的特征提取过程吧? |
|
g****t 发帖数: 31659 | 48 我反对的是你所谓的"basic"一说。
我从没说这三人不比shannon差。你就别东拉西扯了。
你好像基本的文献都不熟悉。
我觉得你应该先学习下然后才发言。
Candes,Tao,Donoho解决的是之前早就被很多人观察到,并且实际应用过的
l1 norm优化可以出稀疏解这个经验事实。做统计的,做特征提取的,
很多情况下要求稀疏解。所以很多人做这个。
这三人的结果不是什么observation。是对已有问题的解决和严格证明。
不是那种修修补补,做不动问题,就自己加条件,自己和自己玩的文章。
(信息论,自控多少年来90%的文章就是这么出来的)
Candes, Tao和Donoho的工作是在大家并不知道compressive sensing的情况下发现的一
个新问题。没有前人铺路的情况下一次把问题做得很深入,那得需要Shannon那种人物
的功力。这三个人水平很高,但是离那种级别还差一些。
吴同学的工作背后站着的是Verdu。我相信这个工作原始的motivation应该不会是吴同
学自己想出来的。至少从他的年龄和经验来说,不应该能到这个程度。Verdu在知道了
我就说 |
|
g****t 发帖数: 31659 | 49 我反对的是你所谓的"basic"一说。
我从没说这三人不比shannon差。你就别东拉西扯了。
你好像基本的文献都不熟悉。
我觉得你应该先学习下然后才发言。
Candes,Tao,Donoho解决的是之前早就被很多人观察到,并且实际应用过的
l1 norm优化可以出稀疏解这个经验事实。做统计的,做特征提取的,
很多情况下要求稀疏解。所以很多人做这个。
这三人的结果不是什么observation。是对已有问题的解决和严格证明。
不是那种修修补补,做不动问题,就自己加条件,自己和自己玩的文章。
(信息论,自控多少年来90%的文章就是这么出来的)
Candes, Tao和Donoho的工作是在大家并不知道compressive sensing的情况下发现的一
个新问题。没有前人铺路的情况下一次把问题做得很深入,那得需要Shannon那种人物
的功力。这三个人水平很高,但是离那种级别还差一些。
吴同学的工作背后站着的是Verdu。我相信这个工作原始的motivation应该不会是吴同
学自己想出来的。至少从他的年龄和经验来说,不应该能到这个程度。Verdu在知道了
我就说... 阅读全帖 |
|
w******9 发帖数: 1604 | 50 常用特征提取方法:Haar、Gabor、LBP、SIFT、HOG等
这些专有名词都不懂,求教
算法了解神的就PCA和HHM
语音识别的基本原理及方法
这个是指hidden markov model??james baker的Dragon算是吧 |
|