杨滔_数据科学
查看新浪微博主页杨滔_数据科学
看 @张栋_机器学习 张栋分享的《微观• 大数据》,收获很多。大数据虽然“大”,但也是从应用案例入手的。没有实在的案例,大数据就空了。 原微博 杨滔_数据科学
RF不适合直接应用于存在大量无关本来的数据:When the number of variables is large, but the fraction of relevant variables small, random forests are likely to perform poorly with small m. At each split the chance can be small that the relevant variables will be selected. 【ESL】 展开全文原微博 杨滔_数据科学
准确预测出未上线的爆款商品(高销量),不仅帮助选品,且帮助找到达人(善于发现爆款的用户),定价@bicloud笑西西 @采琼 @郝大刀 @Dustin_LAM @张栋_机器学习 原微博 杨滔_数据科学
数据挖掘应用不同于学术的特点:1、需求理解,2、大量调试工作,结果说话,3、数据获取与清洗,4、土办法:算法+常识。@车品觉 @bicloud笑西西 @采琼 原微博 杨滔_数据科学
大数据的价值:数据-->算法-->应用。随着应用案例增多,通用算法的价值就会提升,例如,google brain。@车品觉 @采琼 @阿凡 @Dustin_LAM @楚天阔-0803 @赵国栋TMT 原微博 杨滔_数据科学
请教:KNN的"衍生算法"(例如,Weighted KNN, k-d tree based KNN....)有没有精度和效率能和Deep Learning匹配的?@张栋_机器学习 @李航博士 @老师木 @邓侃 @徐盈辉_仁基 @耗资小王 @左耳朵耗子 @李沐mu @胡宁 @余凯_西二旗民工 @北冥乘海生 @独孤虎-李利鹏 展开全文原微博