p**r 发帖数: 5853 | 1 我最近有个项目,每天很多数据要提炼,
数据之间有相似形,但是又各有不同,人工处理是完全不现实的。
所以我不停的写提炼规则提炼数据,
从一开始的60%的成功率,现在差不多90%左右了,差不多也可以了。
反正闲着没事了就根据失败案列,再排除完善提炼规则。
俺是斧头帮,CS一节课都没上过,
感觉这东西好像是用大家嘴里很火的ML解决比较好,
但是看了一些ML的介绍,完全不知道在说什么,
甚至连到底啥是ML也不知道。
各路大神说说,我这算不算是ML,
如果不算,那用ML解决这个问题,比自己写提炼规则的优点在哪里?
目前提炼程序全部都是自动的,
数据自动采集,自动喂提炼程序,成功的到下一步,失败的就留哪里。
我过一段时间就去看看失败的,然后再加一些提炼规则,把失败数据再提炼一次。 |
W***o 发帖数: 6519 | 2 窃以为ML大多是用来预测和识别的,其中的RL 是用来学习的 |
c*****e 发帖数: 3226 | 3 你这属于早期闭门造车。类似于自己写个基于文件的 SQL 模仿系统
【在 p**r 的大作中提到】 : 我最近有个项目,每天很多数据要提炼, : 数据之间有相似形,但是又各有不同,人工处理是完全不现实的。 : 所以我不停的写提炼规则提炼数据, : 从一开始的60%的成功率,现在差不多90%左右了,差不多也可以了。 : 反正闲着没事了就根据失败案列,再排除完善提炼规则。 : 俺是斧头帮,CS一节课都没上过, : 感觉这东西好像是用大家嘴里很火的ML解决比较好, : 但是看了一些ML的介绍,完全不知道在说什么, : 甚至连到底啥是ML也不知道。 : 各路大神说说,我这算不算是ML,
|
n******7 发帖数: 12463 | |
c*******v 发帖数: 2599 | 5 你的优势是domain knowledge
找个现成的ML算法
如果不能成功的注入你的domain knowledge
那还远不如你现在办法呢
你可以把自己的这套办法找个市场人员创造个名词叫做
Xxx ML
卖出去赚钱了
自然有专家来解释你为啥合理
市场竞争惨烈且比较公平
是最好的老师
Big data, deep learning ...
这些都是人造的词。有钱开项目,你也可以花一定资金
自己造一个。这个很重要。
我造过一个,叫做算法的degree of robustness
起到了合适的营销作用
Btw,此ID是guvest的马甲 |
T*******x 发帖数: 8565 | 6 为什么要上马甲?
【在 c*******v 的大作中提到】 : 你的优势是domain knowledge : 找个现成的ML算法 : 如果不能成功的注入你的domain knowledge : 那还远不如你现在办法呢 : 你可以把自己的这套办法找个市场人员创造个名词叫做 : Xxx ML : 卖出去赚钱了 : 自然有专家来解释你为啥合理 : 市场竞争惨烈且比较公平 : 是最好的老师
|
p**r 发帖数: 5853 | 7 看來我水平和板上各路大神相差太遠,
打算努力學習一段時間後,再來BB. |