diff --git a/README.md b/README.md
index 49ff6bb..bc1fb16 100644
--- a/README.md
+++ b/README.md
@@ -1,247 +1,39 @@
-
+#
好东西传送门
+[http://www.weibo.com/haoawesome](http://www.weibo.com/haoawesome)
+* [简介](README.md#简介) : [问答服务](README.md#问答服务), [订阅服务](README.md#订阅服务), [使用许可](README.md#使用许可)
+* [问答与传送档案](README.md#问答与传送档案)
+* [通知与声明](README.md#通知与声明)
-好东西传送门: 微博上的轻问答
-* 关注微博 http://www.weibo.com/haoawesome/
-* 微信号:好东西传送门
-* 网站 http://hao.memect.com/
-还没有回答的问题,欢迎认领 https://github.com/memect/hao/issues
+## 简介
+*好东西传送门* 支持微博上的知识传播,集成微博好人好东西,帮您快速解决问题,为您精选专业知识
+* [欢迎提供建议](https://github.com/memect/hao/issues/new)
-[给我们提建议](https://github.com/memect/hao/issues/new)
-
-目录
-* [最近的问答](README.md#最近的问答)
-* [文摘](README.md#文摘)
-
-本站内容许可证:[Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License](http://creativecommons.org/licenses/by-nc-sa/4.0/)
-
-
-
+2. [订阅好东西周报](http://haoweekly.memect.com/) (邮件列表,每周的问答与资源推荐合集,大约每周五发)
-* 2014-07-19 @AixinSG 大牛给的信息检索方面综述文章列表,涵盖IR方向N多问题 http://t.cn/RPAL69M [ [微博](http://www.weibo.com/1025887594/Behxw9itr) ]
+### 使用许可
+本站内容许可证:[Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License](http://creativecommons.org/licenses/by-nc-sa/4.0/)
+
-* 2014-07-18 @我爱机器学习 【Awesome Machine Learning】http://t.cn/RPZ80gD 一个超级完整的机器学习开源库总结,如果你认为这个碉堡了,那后面这个列表会更让你惊讶:【Awesome Awesomeness】http://t.cn/RPZ80gk 各种编程语言等都有汇总,值得收藏以备不时之需。 [ [微博](http://www.weibo.com/5066241201/Be5JrDaVM) ]
-
-
-* 2014-07-17 @朝花夕拾录 [资源贴] cassendra 2.1 beta rc3新特性:1、 用户自定义数据类型(UDT):支持集合类型Set和Map,以及其上的二级索引; 2、读写速度提高超过50%;3、行数据的聚集(cluster)与缓存(cache);4、counter设计优化,提高安全和一致性;5、更好的压缩机制,用commit log绕过直接读写 http://t.cn/RPzKcaH [ [微博](http://www.weibo.com/3204614242/BdUTtkSrl) ]
-
-
-* 2014-07-17 @唐杰THU 推荐密歇根的H V Jagadish、康奈尔及微软Partner Scientist JOHANNES GEHRKE, Fellow RAGHU RAMAKRISHNAN等数据库专家在Communication of ACM上关于《大数据技术挑战》,从数据获取、抽取、清洗、集成和建模几个过程阐述其中的数据不一致、不完整、动态、隐私等面临的挑战。http://t.cn/RPzk8wG [ [微博](http://www.weibo.com/2126427211/BdYGPBxV8) ]
-
-
-* 2014-07-17 @hbyido 大量的专业书 数学书下载,推荐 万千合集站 一个专注于资源整理、分类和提供免费下载服务的网站 http://t.cn/RvUYeY7 http://t.cn/RvUYeY7 [ [微博](http://www.weibo.com/1646706835/Be1wvuzmc) ]
-
-
-* 2014-07-16 @西瓜大丸子汤 Jim Hendler今天的视频和PPT: Semantic Web: The Inside Story 强烈推荐搞人工智能的同仁都看看 http://t.cn/RP7CLin 语义网作为符号主义走向应用的尝试,也曾获得与深度学习类似的投资与眼球。结合前两天关于AI winter的讨论,其在今天尤其有参考意义 http://t.cn/RP7CLim @王海勋haixun @Gary南京 [ [微博](http://www.weibo.com/1932835417/BdMYzDNz6) ]
-
-* 2014-07-16 @西瓜大丸子汤 http://t.cn/RP7Q1pR 深度学习70+条学习资源。这70多条是从Memect用户过去两年的阅读列表里精选出来的,每一条都经过了人工的过滤。从入门到进阶,各大个公司的应用案例,各种软件包的介绍,实战汇报,基本都是实用内容,理论联系实际。随后我们还会特约专家加以导读和点评。[ [微博](http://www.weibo.com/1932835417/BdOlKoAE0) ]
-
-
-* 2014-07-16 @52nlp "线性代数的学习及相关资源" http://t.cn/zOQBTSC , 这个里面汇集了资源,包括电子版教材, “找到一个不错的电子版,非扫描版并且是第4版:Introduction to Linear Algebra_4ED_Strang” ,昨天有同学私信说爱问的已经废了,刚才上传到百度网盘并做了私密分享,感兴趣的同学请在该文尾部找答案。 [ [微博](http://www.weibo.com/2104931705/BdOSF3lrP) ]
-
-
-* 2014-07-16 @朝花夕拾录 [资源贴]续上文 http://t.cn/RP7N6AS 目前整理出了80多个大数据可视化工具:http://t.cn/RP7N6AK javascript类51个,地图类有21个 ,图表类34个,svg类15个;继续增补中,欢迎指正。 --题外话,大数据可视化也要用美女打广告。猜猜那个帅哥是哪个工具的“代言人”,期待大数据展会的“数模” [ [微博](http://www.weibo.com/3204614242/BdNc7rpSB) ]
-
-* 2014-07-15 @朝花夕拾录 [资源帖]12个#大数据#可视化工具合集汇总,超过一半2014年新出炉。涵盖超过50个#可视化工具#(表格,地图,时间轴,动态图表,树,有向图等),大约80% #javascript#包,例如d3.js,timeline.js,Springy.js。如果说大数据分析是一场足球赛,那数据可视化就是临门一脚。 http://t.cn/RPh1qz5 [ [微博](http://www.weibo.com/3204614242/BdGhf1CNK) ]
-
-* 2014-07-13 @西瓜大丸子汤 http://t.cn/RPvS3im 大数据书籍推荐新增 Cloudera Impala;Apache Sqoop Cookbook;Outlier Detection for Temporal Data;Big Data Now: 2013 Edition。免费pdf推荐:Social Media Mining ,另有9本免费的数据挖掘与数据分析 http://t.cn/RPvS3in [ [微博](http://www.weibo.com/1932835417/BdlrtpCfV) ]
- * @西瓜大丸子汤 9本免费的数据挖掘书之1)Mining of Massive Datasets 斯坦福三大教授Leskovec Rajaraman Ullman 联手推出的免费书,500多页,不是简单的数据挖掘,而是大数据挖掘 http://t.cn/RPv8GTa 这本书的第三章相似分析,第五章链接分析,第九章广告系统当年在我工作中很有用 更多大数据书http://t.cn/RPvS3im [ [微博](http://www.weibo.com/1932835417/BdnvPATOn) ]
- * @西瓜大丸子汤 9本免费的数据挖掘书之2)Data Jujitsu(数据柔术)如何解剖复杂数据,利用替代分析技巧,利用人工分析如Mechanical Turk。我觉的这本书最好和Bad Data一起看 http://t.cn/RPvEhRz 数据挖掘的真实效果80%在数据清理和人工,不是算法。传送门 http://t.cn/RPvEhRZ 更多大数据书http://t.cn/RPvS3im [ [微博](http://www.weibo.com/1932835417/BdnHhEApb) ]
- * @西瓜大丸子汤 9本免费的数据挖掘书之3)Data Mining Algorithms In R http://t.cn/RPPm0Bk 这是一本Wiki书,也就是维基百科上有关的条目组织形成的书。覆盖了:降维方法,常见模式挖掘, 序列数据挖掘,聚类,分类,和R的数据挖掘包导航(RWeka gausspred optimsimplex 等)更多大数据书http://t.cn/RPvS3im [ [微博](http://www.weibo.com/1932835417/BdwSOo0ap) ]
- * @西瓜大丸子汤 9本免费的数据挖掘书之3.1)续上http://t.cn/RPP33gn Data Mining Algorithms In R这书原始格式是网页,不易阅读下载,特制作pdf版,266页 http://t.cn/RPP33gR 。同时推荐Yanchang Zhao的R and Data Mining,160页,都是实战例子 http://t.cn/RPP33gE 如觉得好请支持作者 http://t.cn/RPP33gm [ [微博](http://www.weibo.com/1932835417/Bdx6JeqYf) ]
- * 9本免费的数据挖掘书之4) Theory and Applications for Advanced Text Mining http://t.cn/RPP10t2 这是本理论书,作者大都是学术界的。主题是高级的文本挖掘,如关系提取,时间关系提取,文章总结,本体学习,实体提取等各种高大上专题。了解前沿不可不看。更多大数据书http://t.cn/RPvS3im [ [微博](http://www.weibo.com/1932835417/BdxbrtlOf) ]
-
-* 2014-07-13 @鲍捷AI http://t.cn/RPvxGHA OpenRefine是一个数据清理的优秀工具。它根源于MIT David Karger实验室的研究。该实验室在交互式数据处理的前沿。David Huynh把这个研究带到MetaWeb,也即Freebase团队。被Google收购后,工具改称Google Refine。后来开源成为OpenRefine。这组资源包括了9个必读博客和教程 [ [微博](http://www.weibo.com/3161813504/BdkfSsGI5) ]
- ** @西瓜大丸子汤: Freebase是Google知识图谱的前身。从Wikipedia到Freebase再到知识图谱,不仅有机器的数据清理,也有海量的人工数据清理任务。Google Refine在其中的作用不容低估。具体数值不详,不过来自类似系统TrueKnowledge的报告说:0.1%的手工编辑就可以覆盖10%的用户查询 http://t.cn/RPvxjIF [ [微博](http://www.weibo.com/1932835417/Bdkn96ZY7) ]
-
-* 2014-07-13 @西瓜大丸子汤 http://t.cn/RPvoO88 Python免费书54本,都可以pdf下载。从入门到自然语言处理,科学计算,概率论,经济学,生物信息学,多媒体,密码学,计算机视觉,游戏,社交媒体分析...必有一本适合您 [ [微博](http://www.weibo.com/1932835417/BdlxBqVj1) ]
-
-* 2014-07-12 @赵家平USC Jeff Hinton组把deep CNN(CovNets)在ImageNet上train好的模型放到网上了,试了下classification, retrieval, image2text的在线demo, amazing! http://t.cn/Rvs0Pvj 最重要的是他们的source code以及installation & documentation 也一并公布,超过Rob Fergus学生的Clarifai http://t.cn/8kL993u [ [微博](http://www.weibo.com/2288385870/Bdcr2jitr) ]
-
-* 2014-07-12 @西瓜大丸子汤 http://t.cn/RvsoYMd @骆逸 的微博里提到很多Python干货。从过去两年的微博里选出一百多条,有适合入门的书籍和教程推荐,有机器学习,网络编程,推荐系统,各种实战总结(360, instgram),PyCon等等。http://t.cn/RvsQc5G 和机器学习有关的帖子质量也很高,不少也是和python有关的. 我当年学Python的时候就从@骆逸 的帖子里受益匪浅。大牛以前在雅虎,如今是毕肯互动的CEO [ [微博](http://www.weibo.com/1932835417/BdbNddaCA) ]
-
-* 2014-07-12 @西瓜大丸子汤 http://t.cn/Rvs9BBQ 语义网同仁的福利:本体映射Ontology Mapping项目汇总,一共20多个。入选的都是现在还在活跃的项目,很多都有开源代码。早年的一些项目现在不怎么维护的看这里 http://t.cn/Rvs9BBH @老淘 @潘越_ 徐涵W3China @白硕SH @顾进广 @胡安-格里斯 @昊奋 @唐杰THU @程龚_NJU @汪鹏_SEU [ [微博](http://www.weibo.com/1932835417/Bdc2HxX6g) ]
-
-* 2014-07-12 @朝花夕拾录 #Swift# 资源合集: 官方博客今日(7/11)上线,并两个相关博客。还有4个社区资源导航贴合集,包括 @SwiftLanguage 提供的中文版。最后是Swift PDF合集(包括 8个WWDC的演讲稿,两个官方iBook参考书的PDF版)http://t.cn/RvsJrLy [ [微博](http://www.weibo.com/3204614242/Bdascij7d) ]
-
-* 2014-07-11 @网路冷眼 必须观看的Javascript视频!!!】GitHub网站上 http://t.cn/RvFF0AU 收录了2009年至今必须观看的Javascript视频,其作者Nicholas Zakas,Douglas Crockford...都是Javascript江湖响当当的人物,精彩不容错过! [ [微博](http://www.weibo.com/1715118170/Bd7K4yyRG) ]
-
-* 2014-07-11 @网路冷眼 Docker现在大火,http://t.cn/RvF7fxB 推出史上最全Docker中文资料集萃。真的狠赞![赞] [ [微博](http://www.weibo.com/1715118170/Bd7A4CXMs) ]
-
-* 2014-07-11 @西瓜大丸子汤 Python贝叶斯工具续 http://t.cn/RvFf2Q9 前面介绍过PyMC,Infer.net 此外@朝花夕拾录 还介绍过emcee和pystan。在实战中怎么用呢?bayesian-python这个系列收集了14篇相关文章。http://t.cn/RvFfwUy 这5篇总结了几个工具的实战例程。要节约时间就看系列第一篇总结的表,一目了然 http://t.cn/RvFfwUL [ [微博](http://www.weibo.com/1932835417/Bd1jO3N6N) ]
-
-* 2014-07-10 @西瓜大丸子汤 刚才说到python优化,举个具体的例子 Gensim的作者把word2vec(深度学习)做了几个经典优化:循环,numpy/BLAS,cython,多线程(真的可以)结果效率提高了上千倍,比Google开源出来的原始C版本还快3倍。他最近还写了个word2vec教程。无论是学习word2vec还是python优化,都不可不看 http://t.cn/Rvkt0Hk [ [微博](http://www.weibo.com/1932835417/BcSwEc2iu) ]
-
-* 2014-07-10 @朝花夕拾录 白宫和麻省理工于今年三月举办了“大数据的个人隐私研讨会”。麻省理工校长主持,白宫大数据顾问、美国商业部部长作了主题演讲,还有一堆麻省理工和哈佛的教授研讨了关键技术,包括数据库,加密,匿名,日志分析,语义推理等。相关资源包括每个演讲的视频,以及八个可下载的PPT。http://t.cn/Rvk5BnL [ [微博](http://www.weibo.com/3204614242/BcSoNduiM) ]
- ** 刚刚整理出了4个大数据信息安全关键问题: *数据收集,如何签订合理的用户知情协议 *数据共享,如何保障透明度,控制使用权限,防止数据泄露 *数据使用,如何避免重新识别攻击,防止意外地侵犯个人权益 *数据监管:如何在不同的环境(国家、政府、组织、政策)中监管大数据的运营 [ [微博](http://www.weibo.com/3204614242/BcSJGkVZQ) ]
-
-* 2014-07-09 @西瓜大丸子汤 http://t.cn/RvDWJ20 23个python的机器学习包,从常见的scikit-learn, pylearn2,经典的matlab替代orange, 到最新最酷的Theano(深度学习)和torch 7 (well,其实lua,不过从ipython调用很容易),基本常用的通用python机器学习平台都有了。 [ [微博](http://www.weibo.com/1932835417/BcLRAbXWr) ]
-
-* 2014-07-09 @西瓜大丸子汤 在推荐一本我最近正在看的书Probabilistic Programming and Bayesian Methods for Hackers 贝叶斯方法实战,用Python来解释各种概率推理方法,有代码有真相。基于PyMC 包,解剖了MCMC ,大数定律,金融分析等概念与应用。Github上已经有5000颗星。更多python统计方法资源 http://t.cn/RvDJLy6 [ [微博](http://www.weibo.com/1932835417/BcKj0k0Wx) ]
-
-* 2014-07-09 @朝花夕拾录 #大数据#产业化的一个重要指标:超过20家美国商学院(例如UVA,RPI,GWU)开设了大数据和数据分析硕士课程,而且有一半学校的课程只要一年就能毕业。这个可是转型成高富帅的绝佳机会呦。http://t.cn/RvDVtXm --我是分割线-- 呵呵,还有个IIT,这可不是印度学校,是伊利诺伊理工大学。 [ [微博](http://www.weibo.com/3204614242/BcJOW5uIt) ]
-
-* 2014-07-09 @西瓜大丸子汤 Spark Summit 2013的PPT和教程合集整理在此 http://t.cn/RvDVO9I ,一共33个。和昨天放出了60个Spark Summit 2014的PPT一起,基本涵盖了近期spark的动态与产业布局。http://t.cn/RvewMsv 和去年比,今年峰会的内容无论数量还是应用的广度与深度,都大幅增长了。例如去年没有自然语言处理,今年有两个 [ [微博](http://www.weibo.com/1932835417/BcJR80Opo) ]
-
-* 2014-07-08 @何_登成 分享下最近看的几篇关于分布式KV/NoSQL的论文与资料:1. aerospike http://t.cn/RveVR9I 2. facebook memcache http://t.cn/RvjMGCj 3. redis cluster http://t.cn/zRPS3Q8 4. 腾讯CKV http://t.cn/8s7PSiN 5. 淘宝Tair http://t.cn/zjkhVoF 简单点评:架构大同小异,各有特色,可相互借鉴。[ [微博](http://www.weibo.com/2216172320/BcB68hq0Q) ]
-
-* 2014-07-08 @西瓜大丸子汤 Spark Summit 2014全部PPT合集 http://t.cn/RvewMsv Spark是新一代大数据处理平台,基于内存的集群计算使它比MapReduce快一百倍,非常适合迭代计算和并行机器学习。合集包括了全部60个演讲的PPT(除了一个链接失效)预览和下载。AMP Lab, Databricks, Cloudera, MapR, Amazon等重量级厂家一网打尽 [ [微博](http://www.weibo.com/1932835417/BczEbsqJz) ]
-
-* 2014-07-07 @西瓜大丸子汤
-继续推荐几个python NLP的资源。http://t.cn/RvgckyQ NLTK book是入门必读。 http://t.cn/RvgckyY @陈涛sean 做了中文翻译《用Python进行自然语言处理》可免费下载。http://t.cn/RvgckyH Jimmy Lin(前马里兰教授)有书和博客讲并行NLP http://t.cn/RvgckyT 基于Hadoop 和MR [ [微博](http://www.weibo.com/1932835417/BcsuDegCM) ]
-
-* 2014-07-07 @ansj 500w 的公司名录,只包含公司名称 , 用来做组织机构命名实体识别.链接: http://t.cn/Rvgy9sg 密码: 3a1q http://t.cn/Rvgy9oC [ [微博](http://www.weibo.com/1434895303/BcrHqhZMK) ]
-
-* 2014-07-06 @西瓜大丸子汤 http://t.cn/RvdhLRA Text Processing in Python 一本讲python文本处理的小书,涵盖了基本字符串,正则表达式,状态机,和互联网文本处理的基本点。印刷版在亚马逊上卖41刀,文字电子版免费下载 [ [微博](http://www.weibo.com/1932835417/Bch0GlR1u) ]
-
-* 2014-07-05 @王威廉
-鉴于大家对Wasserman的统计笔记反响不错,我就再推荐一本他的经典统计入门教材All of Statistics: A Concise Course in Statistical Inference http://t.cn/RvrzVBw pdf: http://t.cn/RvrzVBA 这本书获得过国际贝叶斯分析协会的DeGroot奖。[ [微博](http://www.weibo.com/1657470871/Bc7QqbYSV) ]
-
-* 2014-07-04 @西瓜大丸子汤 把最近比较重要的关于Watson的资料分了类 十多个pdf http://t.cn/Rv1BOxx IBM自己的介绍 http://t.cn/Rv1BOxX 媒体报导 http://t.cn/Rv1BOx6 Watson在卫生领域的应用 http://t.cn/Rv1BOxJ 音频视频 http://t.cn/Rv1BOxi 其他应用 http://t.cn/Rv1BOxa [ [微博](http://www.weibo.com/1932835417/BbXC4v3ec) ]
-
-* 2014-07-04 @朝花夕拾录 七月三日新鲜出炉 #大数据#资源帖。。。24个知名掌门级别(CxO)大数据专家及其推特账号。有来自于大企业的(例如Google, KDnuggets, TeraData,IBM,和Ford ),但更多的来自创新企业。咱不指望他们都会编Hadoop程序,但他们在业内的影响力那是刚刚嘀--全是推特万人大V。 http://t.cn/RvBJqDr [ [微博](http://www.weibo.com/3204614242/Bc1c2bbHT) ]
-
-* 2014-07-03 @西瓜大丸子汤 http://t.cn/Rv3gsW2 今天的一大新闻是IBM的BlueMix:基于Watson自然语言问答系统的云服务。以前的工作也和问题有关,这里先放几篇读过的Watson的文章和slides。AAAI Magzine 2010的文章有点老,不过作为提纲还是推荐一读。IBM Journal 2012专辑选了3篇文章,在语言解析与语义数据的应用 [ [微博](http://www.weibo.com/1932835417/BbPNRnN0J) ]
-
-* 2014-06-24 @西瓜大丸子汤 http://t.cn/RvYTJ3r 《世界杯的大数据和小数据》这组专题汇集了2010和2014年世界杯的数据。2010年BBC利用语义数据做了动态新闻发布,降低记者写作和BBC的内容发布成本。OpenLink今天发布了2014世界杯数据的RDF版,包括各队,球员和分组的可查询数据。还有football.db历年的数据,和World Cup in JSON [ [微博](http://www.weibo.com/1932835417/Bar9NnkmF) ]
-
-* 2014-06-24 @ShangguanRPI
-作为看到整篇整篇java mapreduce代码就想吐的scala脑残粉,肯定不能放过scalding。放出平时积累的一点scalding的学习资料,http://t.cn/RvYmfSX。
-
-
-* 2014-06-21 @朝花夕拾录[资源帖]十几个图像处理中常用的python包。NumPy和SciPy必装,图像处理:PIL/PILLOW入门,SimpleCV进阶,OpenCV专业。还有Mahotas ,ilastik,MedPy多用于生物医学多维图像处理。辅助工具:scikit-learn机器学习,sh5py数值数据存储(numpy数组),pprocess并发处理。http://t.cn/RvWmogb [ [微博](http://www.weibo.com/3204614242/B9YZ3ftu3) ]
-
-* 2014-06-21 @朝花夕拾录 [资源帖] pypy3.2.1(Fulcrum,支点)于6月20日发布。http://t.cn/RvlC1JG 是第一个pypy3稳定版,支持python3.2.5,改进了unicode,JIT,GC。 参考:cpython, jython(java), ironpython (.net). 讨论:还不支持numpy,ctypes(但有numpypy);windows 64bit还不支持;有人测出了7倍加速(一般4~5倍)。[ [微博](http://www.weibo.com/3204614242/Ba5pTw5bo) ]
-
-* 2014-06-20 @朝花夕拾录 五篇python贝叶斯入门短文,以及三个常用工具: emcee , pymc, pystan, http://t.cn/RvOj4nM 顺路说说统计学两大门派: 频率派(Frequentists)和 贝叶斯派(Bayesians) *Frequentists的长远目标是只有5%的时间犯错误 *Bayesians隐约期待马,瞥见一头驴,坚信(95%的可能性)他看到了一头骡子 [ [微博](http://www.weibo.com/3204614242/B9MZ7kdEv) ]
-
-* 2014-06-20 @ShangguanRPI Pivotal是一家新兴的大数据和企业PaaS解决方案提供商,由EMC、Vmware和GE在2013年合资成立,将自家的大数据技术重新架构在Hadoop平台上。这个专题资源汇总了20多篇Pivotal产品的介绍和新闻,如MPP SQL on Hadoop,在Docker上部署Hadoop,如何用PivotalR做大数据分析等 http://t.cn/RvOBEIF。[ [微博](http://www.weibo.com/1663264965/B9QvKpz94) ]
-* 2014-06-19 @朝花夕拾录 #大数据专题# 12个与#2014世界杯#相关的在线资源:(1)总结如何预测冠军得主;(2)大数据应用例程(bing, sas, rapidminner); (3)免费在线数据库,可下载(football.io, json api)。 http://t.cn/Rv0OOd2 [ [微博](http://www.weibo.com/3204614242/B9EtcxrE4) ]
-* 2013-09-20 @developerWorks 免费电子书《面向程序员的数据挖掘实战指南》,侧重实例,以 Python 语言讲解。目前已完成6章,仍在更新中,并且提供 PDF 下载。http://t.cn/zWQEQH8 作者:Ron Zacharski cc @ResysChina [ [微博](http://www.weibo.com/1894238970/Aai5HCiWx) ]
+## 问答与传送档案
+最新的内容请看好东西周报 [http://haoweekly.memect.com/](http://haoweekly.memect.com/) , 每周更新
-* 2013-01-28 @陈利人 【机器学习中的数学系列】回归、梯度下降 http://t.cn/hDoULu ;线性回归,偏差、方差权衡 http://t.cn/Sxppf2 ;模型组合之Boosting与Gradient Boosting http://t.cn/SP05f3 ;线性判别分析, 主成分分析 http://t.cn/SAeY2U ;强大的矩阵奇异值分解及其应用 http://t.cn/akJxgj [ [微博](http://www.weibo.com/1915548291/zgzoTcvzL) ]
+2014-11以前的内容看 [存档](https://github.com/memect/hao/blob/master/archive-2014.md)
diff --git a/archive-2014.md b/archive-2014.md
new file mode 100644
index 0000000..44e86a1
--- /dev/null
+++ b/archive-2014.md
@@ -0,0 +1,2355 @@
+
+2014-11-06 @茶是真热 推荐的微博上的运维方面人士id :第三组3个: @陈沙克 (虚拟化) @vpsee (虚拟化) @扶凯 (看他网站吧,微博上说的不多) 这些是在微博发表较多的,排名无先后。很多公司内的扫地老僧不太公开表达。完整列表http://t.cn/R78mgBL 欢迎大家继续推荐 [ [微博](http://www.weibo.com/5220650532/Bv1ICjxXT) ]
+
+2014-11-06 @茶是真热 推荐的微博上的运维方面人士id :第二组5个:@绿小小肥 (salt) @wilbur井源 @诸超_小石头爸爸 @大舞-ukl @王关胜 (除了很专业还有很帅) 完整列表http://t.cn/R78mgBL [ [微博](http://www.weibo.com/5220650532/Bv1HQ9wAH) ]
+
+2014-11-06 @茶是真热 推荐的微博上的运维方面人士id :第一组5个:@Perldaily (perl,运维工具和体系) @Argv (elk,perl) @平凡的香草 @刘天其斤 @jaseywang 完整列表http://t.cn/R78mgBL [ [微博](http://www.weibo.com/5220650532/Bv1HuyZKM) ]
+
+2014-11-06 Google大牛讲解深度学习规模化方法,融汇机器学习和系统的前沿。@Kurtt_Lin 做了现场摘要和点评,并分享了PPT照片。推荐到今天的微信头条 http://t.cn/R78aEoJ [ [微博](http://www.weibo.com/5220650532/Bv0fFsXo4) ]
+
+> 2014-11-05 @Kurtt_Lin: #Face to Face with Dr. Jeff Dean# 下午在THU FIT楼听了Jeff Dean大规模深度学习的talk,也算追了“男神”一把[呵呵]。后面与Jeff交流时感觉到,他超级nice,谦虚和善,时不时也幽默一把,结束时也很有活力地喊大家一起合影。Talk内容和ppt请见:http://t.cn/R7QcsHn [ [微博](http://www.weibo.com/1567257743/BuTRS111V) ]
+
+2014-11-06 感谢 @Kurtt_Lin @tedsky2 @王威廉 @网路冷眼 @王威廉 今天继续有CIKM现场报道。另外Jeff Dean清华报告也有多人从不同角度分享,都在长版中 http://t.cn/R78fAlG [ [微博](http://www.weibo.com/5220650532/BuZGVzF24) ]
+
+> 2014-11-06 @好东西传送门: 机器学习头条 2014-11-05 http://t.cn/R78fAl4 1)Jeff Dean大规模深度学习报告 2)压缩采样介绍 3)Yago创始人Gerhard Weikum提出“大文本”概念 4)将Elasticsearch和Apache Spark部署到云端 5)NIPS 2014的大规模分布式机器学习研讨会的论文 加长版52条 http://t.cn/R78fAlG [ [微博](http://www.weibo.com/5220650532/BuZG0yHpu) ]
+
+2014-11-06 机器学习头条 2014-11-05 http://t.cn/R78fAl4 1)Jeff Dean大规模深度学习报告 2)压缩采样介绍 3)Yago创始人Gerhard Weikum提出“大文本”概念 4)将Elasticsearch和Apache Spark部署到云端 5)NIPS 2014的大规模分布式机器学习研讨会的论文 加长版52条 http://t.cn/R78fAlG [ [微博](http://www.weibo.com/5220650532/BuZG0yHpu) ]
+
+2014-11-06 数据科学小技巧汇总小小册子 //@phunter_lau: 不错,技巧的占的部分比较大,适合摸爬滚打多年的人看看 [ [微博](http://www.weibo.com/5220650532/BuXZdC32q) ]
+
+> 2014-11-06 @西瓜大丸子汤: Data Science by AnalyticBridge http://t.cn/R7Qr3kL 一本小书, [ [微博](http://www.weibo.com/1932835417/BuXeOEYcv) ]
+
+2014-11-05 这个入门系列博文非常好,节约初学者啃大不部头的时间。推荐到今天的微信摘要版: http://t.cn/R7HNHFw [ [微博](http://www.weibo.com/5220650532/BuQCTrwWn) ]
+
+> 2014-11-04 @研究者July: 已写的:①决策树http://t.cn/zOmMFLa,②SVMhttp://t.cn/zOeaL7j,③K近邻http://t.cn/zjLQ8Ky,④数理统计http://t.cn/zj9kZ8a,⑤最大熵http://t.cn/R7atoLH,⑥Adaboosthttp://t.cn/R7lXmhC,⑦谱聚类http://t.cn/R7jLDaB,待写的还远不只是这些:贝叶斯网络、EM、主题模型、HMM、CRF、PCA、LDA。 [ [微博](http://www.weibo.com/1580904460/BuLqE1mj8) ]
+
+2014-11-05 十分感谢推荐。格灵深瞳是中国最好的计算机视觉公司之一,右边经常分享一些很好的CV学习资源,机器学习日报里也常常可以看到的。[呵呵]//@格灵深瞳: 推荐一下好东西~欢迎分享@有需要的人~[熊猫] [ [微博](http://www.weibo.com/5220650532/BuQnWao51) ]
+
+> 2014-10-14 @好东西传送门: 很多人问到怎么订阅<机器学习日报>.为方便大家,做了个订阅按钮在主页上,域名 ml.memect.com http://t.cn/R7ZepFz .或给 hao@memect.com 发封空信,标题是 " 订阅机器学习日报 " 即可.另外,过去几期长短版的链接都加到主页上了. [ [微博](http://www.weibo.com/5220650532/BrvCDmx41) ]
+
+2014-11-05 //@CSDN_CODE: 邱锡鹏教授认为,目前云计算逐渐成为一个基础设施,给很多个人以及中小企业提供了低成本的解决方案,自然语言处理技术也会逐渐成为一种基础服务。要从事自然语言处理技术相关研究和开发,最好是从某个具体问题入手,了解最新的研究进展,然后借助一些开源的工具,逐渐了解 [ [微博](http://www.weibo.com/5220650532/BuQmrmtAh) ]
+
+> 2014-11-05 @CSDN_CODE: #开源专访# 【复旦@邱锡鹏 教授:云时代,NLP也将是一种基础服务】之前报道过复旦大学推出了基于云的自然语言处理开源项目FudanNLP,大家反馈积极。对此我们进行了深度采访,项目负责人邱锡鹏教授谈了目前自然语言处理技术发展的两大瓶颈,一是大规模语料库,二是语义表示:http://t.cn/R7HS4EO [ [微博](http://www.weibo.com/3460619722/BuQg92KvP) ]
+
+2014-11-05 感谢 @研究者July @PyPINews @tedsky2 @鲁东东胖 @我爱机器学习 今天长版的重头戏是CIKM的各种现场报道,不可错过。另外最近@bitslife 也分享了很多机器学习在生物信息学中的应用,向对bioinformatics感兴趣的同学推荐。 [ [微博](http://www.weibo.com/5220650532/BuQlJm3gp) ]
+
+> 2014-11-05 @好东西传送门: 机器学习头条 2014-11-04 http://t.cn/R7HoMMU 1)研究者July的数据挖掘博文系统汇总 2)SnowNLP中文自然语言处理工具包 3)林智仁:线性模型+特征工程 的机遇和挑战 4)神经网络实现侧向抑制的讨论 5)Learning To Rank之LambdaMART的前世今生 加长版60条 http://t.cn/R7HoMMy [ [微博](http://www.weibo.com/5220650532/BuQkI6i3G) ]
+
+2014-11-05 机器学习头条 2014-11-04 http://t.cn/R7HoMMU 1)研究者July的数据挖掘博文系统汇总 2)SnowNLP中文自然语言处理工具包 3)林智仁:线性模型+特征工程 的机遇和挑战 4)神经网络实现侧向抑制的讨论 5)Learning To Rank之LambdaMART的前世今生 加长版60条 http://t.cn/R7HoMMy [ [微博](http://www.weibo.com/5220650532/BuQkI6i3G) ]
+
+2014-11-05 http://t.cn/hRgMJ 可视化方法的元素周期表,总结了6大类100种方法,每种都有图例。打印出来帖在案头吧 [ [微博](http://www.weibo.com/5220650532/BuOg55Tpb) ]
+
+2014-11-04 目测为会引发极佳讨论的问题,传送门讲收集和增补大家的问答。跟踪页 http://t.cn/R7TfwMN [ [微博](http://www.weibo.com/5220650532/BuJ5dDT40) ]
+
+> 2014-11-04 @丕子: PCA, SVD(其他low rank*), LDA(Topic Model), K-means, Sparse Coding,Hidden Layer of Neural Network。。。等等这一大类问题应该都可以用一套理论来解释其几何意义,与向量空间、矩阵、特征值和特征向量有关的,有阐述最本质原理的文章? 比特征值和特征向量更低层的?@好东西传送门 [ [微博](http://www.weibo.com/1665335994/BuGdVDyhN) ]
+
+2014-11-04 根据我们的非科学统计,在@好东西传送门 的门友中,各种微博上笔记软件的被使用次数依次是 我的印象笔记 mywiz 有道云笔记收藏 mark,比例为12 : 3 : 1.6 : 1 @印象笔记 拔得头筹 [ [微博](http://www.weibo.com/5220650532/BuICza8If) ]
+
+2014-11-04 @王威廉 昨天推荐的“Olivier Grisel简要总结机器学习,深度学习近年进展”,传送门做了摘要版,节选了其中的核心页面,发在微信版里了 http://t.cn/R7Tzge6 原PPT号称30分钟了解,这个摘要版大概10分钟可以读完。 [ [微博](http://www.weibo.com/5220650532/BuHZWt5fq) ]
+
+2014-11-04 回复@禅系一之花: 请看以前的问答整理: 2014-09-10 [资料整理]《Bayesian network与python概率编程实战入门》http://t.cn/RhcnZrY //@禅系一之花:请问有没有用Python学习概率论的书籍呀? [ [微博](http://www.weibo.com/5220650532/BuHEimICg) ]
+
+> 2014-11-04 @好东西传送门: 机器学习头条 2014-11-03 http://t.cn/R7YWAZ5 1)Olivier Grisel简要总结机器学习,深度学习近年进展 2)从拉普拉斯矩阵说到谱聚类 3)SVD介绍PPT 4)张巍介绍HMM 5)MLOSS机器学习开源工具集 加长版26条 http://t.cn/R7YWAZb [ [微博](http://www.weibo.com/5220650532/BuG6rqvyJ) ]
+
+2014-11-04 感谢 @王威廉 @研究者July @了了JIANG @Nietzsche_复杂网络机器学习 @52nlp [ [微博](http://www.weibo.com/5220650532/BuG6vxAGT) ]
+
+> 2014-11-04 @好东西传送门: 机器学习头条 2014-11-03 http://t.cn/R7YWAZ5 1)Olivier Grisel简要总结机器学习,深度学习近年进展 2)从拉普拉斯矩阵说到谱聚类 3)SVD介绍PPT 4)张巍介绍HMM 5)MLOSS机器学习开源工具集 加长版26条 http://t.cn/R7YWAZb [ [微博](http://www.weibo.com/5220650532/BuG6rqvyJ) ]
+
+2014-11-04 机器学习头条 2014-11-03 http://t.cn/R7YWAZ5 1)Olivier Grisel简要总结机器学习,深度学习近年进展 2)从拉普拉斯矩阵说到谱聚类 3)SVD介绍PPT 4)张巍介绍HMM 5)MLOSS机器学习开源工具集 加长版26条 http://t.cn/R7YWAZb [ [微博](http://www.weibo.com/5220650532/BuG6rqvyJ) ]
+
+2014-11-04 跨媒体知识库构建,今年第三个重要教程 //@昊奋: 继SIGMOD和KDD的相关tutorial之后的另外一个关于KG的重量级tutorial,跨媒体知识库构建是一个趋势,特别对于移动互联网时代。不过链接有些贴错,纠正如下 http://t.cn/R7Y4g7n http://t.cn/R7Y4g7E [ [微博](http://www.weibo.com/5220650532/BuEEdbCkq) ]
+
+> 2014-11-03 @王海勋haixun: ACM MM 2014 Tutorial with Lexing Xie: Learning Knowledge Bases for Text and Multimedia Part 1 (http://t.cn/R7YUd9Q Part 2(http://t.cn/R7YUd9H [ [微博](http://www.weibo.com/2083726665/BuCjWCcsC) ]
+
+2014-11-03 好东西周报 http://t.cn/R7jhDtE 过去一周一共有66条 欢迎订阅 [ [微博](http://www.weibo.com/5220650532/BuxypsIGP) ]
+
+2014-11-03 好消息 //@Python开发者: 好福利,转需扩散啊!!! [ [微博](http://www.weibo.com/5220650532/BuxbkomB5) ]
+
+> 2014-11-03 @伯乐头条: 福利:Jetbrains 推出 PyCharm 教育版,学生和教师免费使用,详见: http://t.cn/R7l12U8 cc: @Python开发者 [ [微博](http://www.weibo.com/3844704614/BuwQnpYjN) ]
+
+2014-11-03 @lifelogger 推荐个opencv for python的网站 http://t.cn/R7luikW 提供很多以图像搜索为目标的相关tutorial [ [微博](http://www.weibo.com/5220650532/BuwT4FQEg) ]
+
+> 2014-11-01 @cvnote计算机视觉笔记: 看到一博文,讲计算机视觉的四部奇书(应该叫经典吧),分别是Hartley的《多图几何》、Gonzalez的《数字图像处理》、Szeliszi的CV:Algorithm&Application、Sonka等的《图像处理,分析与机器视觉》。前三本有看过,或理论深刻或讲解细致或涉猎广泛。感觉还真想不出更经典的作品了。各位还有什么推荐么 [ [微博](http://www.weibo.com/3812841100/BuilLhEY1) ]
+
+2014-11-03 100 numpy exercises 简洁有力的python数值计算入门 [ [微博](http://www.weibo.com/5220650532/BuwSwFL65) ]
+
+> 2014-11-03 @智博是小叮当: 100 numpy exercises The goal is both to offer a quick reference for new and old users and to provide also a set of exercices for those who teach. http://t.cn/R7l3yzj @好东西传送门 [ [微博](http://www.weibo.com/1646120672/BuwLhfhzj) ]
+
+2014-11-03 //@路确实脚下: 再推荐两本好书《computer vision a reference guide 》和《dictionary of computer vision and image processing》//@好东西传送门:总结各位的增补 @星空下的巫师《学习OpenCV》@Nobunaga_Means《computer&machine vision》@路确实脚下 《Moden computer vision》 [ [微博](http://www.weibo.com/5220650532/BuwS6mClz) ]
+
+> 2014-11-01 @cvnote计算机视觉笔记: 看到一博文,讲计算机视觉的四部奇书(应该叫经典吧),分别是Hartley的《多图几何》、Gonzalez的《数字图像处理》、Szeliszi的CV:Algorithm&Application、Sonka等的《图像处理,分析与机器视觉》。前三本有看过,或理论深刻或讲解细致或涉猎广泛。感觉还真想不出更经典的作品了。各位还有什么推荐么 [ [微博](http://www.weibo.com/3812841100/BuilLhEY1) ]
+
+2014-11-03 感谢 @梁斌penny @李沐M @哈工大深圳_徐睿峰 @cvnote计算机视觉笔记 @刘知远THU [ [微博](http://www.weibo.com/5220650532/BuwQYlls1) ]
+
+> 2014-11-03 @好东西传送门: 机器学习头条 2014-11-02 http://t.cn/R7l1KEq 1)推荐系统中bias和个性化的讨论 2)推荐系统两个最好的教程 3)电子书 《Social Media Mining An Introduction》 4)计算机视觉的四部经典 5)华为诺亚方舟实验室做的小诺机器人 加长版44条 http://t.cn/R7l1KEG [ [微博](http://www.weibo.com/5220650532/BuwQTl29A) ]
+
+2014-11-03 机器学习头条 2014-11-02 http://t.cn/R7l1KEq 1)推荐系统中bias和个性化的讨论 2)推荐系统两个最好的教程 3)电子书 《Social Media Mining An Introduction》 4)计算机视觉的四部经典 5)华为诺亚方舟实验室做的小诺机器人 加长版44条 http://t.cn/R7l1KEG [ [微博](http://www.weibo.com/5220650532/BuwQTl29A) ]
+
+2014-11-03 总结各位的增补 @星空下的巫师《学习OpenCV》@Nobunaga_Means《computer&machine vision》@路确实脚下 《Moden computer vision》 [ [微博](http://www.weibo.com/5220650532/Buwxdfsdp) ]
+
+> 2014-11-01 @cvnote计算机视觉笔记: 看到一博文,讲计算机视觉的四部奇书(应该叫经典吧),分别是Hartley的《多图几何》、Gonzalez的《数字图像处理》、Szeliszi的CV:Algorithm&Application、Sonka等的《图像处理,分析与机器视觉》。前三本有看过,或理论深刻或讲解细致或涉猎广泛。感觉还真想不出更经典的作品了。各位还有什么推荐么 [ [微博](http://www.weibo.com/3812841100/BuilLhEY1) ]
+
+2014-11-03 为云设计的开源操作系统 osv.io 这里有各种平台(本地,EC2, GCE, Capstan)上跑的指南 http://t.cn/R7lY1w6 [ [微博](http://www.weibo.com/5220650532/BuvUesnP2) ]
+
+> 2014-10-29 @ShangguanRPI: 下一个玩具OSv http://t.cn/RhoIkLB,极有潜力。 [ [微博](http://www.weibo.com/1663264965/BtJUhBNsY) ]
+
+2014-11-02 @历史无限好 想做运维,不知道从何下手,能不能推荐些初级学习的资料。@茶是真热 整理了一个答案:awesome sysadmin已经非常全面了。各种常用工具、服务、HA结构的安装配置、性能、调优均涵盖。说一些比较基础的部分:先推荐两个网站,和linux使用很相关。都是拷过来答案就用的...http://t.cn/R7WQaH2 [ [微博](http://www.weibo.com/5220650532/BupNzg4Dt) ]
+
+2014-11-02 kaggle竞赛的获奖感言。都是些很实在的小经验,小教训,没有空话套话 http://t.cn/zjtKTWO --kaggle的口号“no free hunch”这些大实话里都体现了 [ [微博](http://www.weibo.com/5220650532/BupKBb4rf) ]
+
+2014-11-02 #求助# 代网友问:ensemble learning和boosting的综述,中文的有哪些推荐? issue 314 http://t.cn/R7WHzm3 [ [微博](http://www.weibo.com/5220650532/BupH84mZB) ]
+
+2014-11-02 15本Hadoop好书。整理者Matthew Rathbone http://t.cn/RvNhW1M [ [微博](http://www.weibo.com/5220650532/BuptZoVCf) ]
+
+2014-11-02 //@phunter_lau: 我觉得很好,好比挖掘技术,Alex的讲座偏向于深入挖掘机操作技术,Xavier偏重不同工地的综合挖掘方法,结合自己实际工作的问题理解这两方面都很重要(新浪微博的推荐系统就是第一个理解不深入第二个不屑于去理解,这是反面教材) [ [微博](http://www.weibo.com/5220650532/BuoyPfeK0) ]
+
+> 2014-11-02 @李沐M: 翻了翻推荐系统的tutorial slides,目前发现的最好的两个:一是alex前年在berkeley上课用的,简练,清晰,重点都覆盖到了 http://t.cn/R7WtFwj 二是xavier在今年cmu夏季课程用的,4小时时长,很全面。http://t.cn/R7WtFwY @phunter_lau 你怎么看? [ [微博](http://www.weibo.com/1953709481/BunUgk0Fu) ]
+
+2014-11-02 http://t.cn/R7WIf7e 做了一张卡片,有和预览和pdf,如果原链接打不开的可以试试。//@李武军nju: 回复@好东西传送门:可能跟我们系的服务器有关。以前有人发现用chrome浏览器不能下载,用IE直接点击打不开,但用IE点右键“另存为”可以。 //@好东西传送门:好像打不开 [ [微博](http://www.weibo.com/5220650532/Buo8a1ONj) ]
+
+> 2014-11-01 @李武军nju: 昨天在我们系 计算机软件新技术国家重点实验室 青年学者论坛上 做了一个报告,简要介绍了近期我们在“大数据机器学习”方面的几点尝试,包括:哈希学习,分布式学习,随机学习。分享一下胶片: http://t.cn/R7O4Ojm [ [微博](http://www.weibo.com/2309457710/Buhn8E6cw) ]
+
+2014-11-02 全书pdf链接直达http://t.cn/8sHGN56 也可以分章下载 2 Graph essentials 3 Network measures 4 Network models 5 Data mining essentials 6 Community analysis 7 Information diffusion in Social Media 8 Influence and homophily 9 Recommendation in social media 10 Behavior analytics [ [微博](http://www.weibo.com/5220650532/BunExtGfV) ]
+
+> 2014-11-02 @哈工大深圳_徐睿峰: #SMP2014# 亚利桑那州立大学 Mining Social Media : Look ahead 推荐了一本书 《Social Media Mining An Introduction》下载地址 http://t.cn/R7WGPrZ [ [微博](http://www.weibo.com/1494777880/BunDk9NrV) ]
+
+2014-11-02 感谢 @李武军nju @好东西传送门 @NLPJob @Kevin_机器学习_CA @西瓜大丸子汤 另外昨天的重点新闻是第三届全国社会媒体处理大会SMP2014,龙星镖局,刘知远,梁斌等分享了会上的热点。@小诺_Noah 原来是华为的机器人——李航已经分享了slides,会放入明天的日报 [ [微博](http://www.weibo.com/5220650532/Bunj13yjw) ]
+
+> 2014-11-02 @好东西传送门: 机器学习头条 2014-11-01 http://t.cn/R7WLGwp 1)李武军谈大数据机器学习 2)三代机器学习算法实现的演化 3)Klein和Manning关于最大熵模型PPT 4)caffe on windows 带cudnn 5)微信公众平台新增语义理解接口 加长版44条 [ [微博](http://www.weibo.com/5220650532/BunhBifai) ]
+
+2014-11-02 机器学习头条 2014-11-01 http://t.cn/R7WLGwp 1)李武军谈大数据机器学习 2)三代机器学习算法实现的演化 3)Klein和Manning关于最大熵模型PPT 4)caffe on windows 带cudnn 5)微信公众平台新增语义理解接口 加长版44条 [ [微博](http://www.weibo.com/5220650532/BunhBifai) ]
+
+2014-11-02 好东西,在Windows上也可以跑caffe。#深度学习# [ [微博](http://www.weibo.com/5220650532/Bumya5cuQ) ]
+
+> 2014-11-01 @Kevin_机器学习_CA: build 了一个最新的caffe on windows 带cudnn http://t.cn/R70cmkA 需要的话可以去下载 然后把所有需要的第三方库也打包了 [ [微博](http://www.weibo.com/2798235231/BudDI8ruZ) ]
+
+2014-11-02 数据科学关于安全的经典文章列表:Jason Trost整理的和安全有关的重要文章,都有pdf链接,覆盖领域:入侵检测,恶意软件Malware,数据收集,脆弱性分析,隐私与匿名,数据挖掘,网络犯罪,网络战等。入门必读。http://t.cn/RP21a3E [ [微博](http://www.weibo.com/5220650532/Bumenc14Y) ]
+
+2014-11-02 很有用的一个Python小工具dedupe,可以在csv或者数据里做数据去重(data deduplication)和实体消解(entity-resolution) Github http://t.cn/R7OkNyx 项目文档 http://t.cn/R7OkNyI 例子http://t.cn/R7OkNyM [ [微博](http://www.weibo.com/5220650532/BulWsq7fX) ]
+
+2014-11-02 先抛个砖:Awesome Sysadmin列表 详列了运维各种工具 http://t.cn/Rvj361W [ [微博](http://www.weibo.com/5220650532/BulFYkusW) ]
+
+> 2014-07-18 @历史无限好: 感觉自己不是开发的料,想做运维,不知道从何下手,能不能推荐些初级学习的资料,特别是ubuntu的,辛苦了[嘻嘻]@好东西传送门 http://t.cn/RPZdYr7 [ [微博](http://www.weibo.com/3150925993/Be6Y08pKI) ]
+
+2014-11-02 今年Hadoop Summit的主题演讲视频都在线,一共12个 http://t.cn/R7Oe3LG 具体题目请看图片,涉及云计算的方方面面 [ [微博](http://www.weibo.com/5220650532/BulCsy2vd) ]
+
+2014-11-02 求助! 求一句话点播。如果恰好知道什么资源分享一下吧。 [ [微博](http://www.weibo.com/5220650532/BukdIlJrm) ]
+
+> 2014-11-02 @__initial__: 针对中文文本情感分析 有哪些现成的工具包?@好东西传送门 http://t.cn/z8AqbYq [ [微博](http://www.weibo.com/1624579831/BujP92mhz) ]
+
+2014-11-02 小诺机器人的秘密 //@李航博士: 报告的slides在这里。 http://t.cn/R7OHblX [ [微博](http://www.weibo.com/5220650532/BujF0dTzF) ]
+
+> 2014-11-01 @刘知远THU: #SMP2014# @李航博士 老师介绍华为诺亚方舟实验室做的小诺机器人 @小诺_Noah 是很有意思的方向,可以自动关注人,转发帖子,评论。未来可以用上很多技术,例如摘要,翻译,自动问答,情感分析,等等。想象空间很大。 http://t.cn/R7pi9t3 [ [微博](http://www.weibo.com/1464484735/BuelGluCo) ]
+
+2014-11-01 //@DP金澜涛: 第一个tutorials是关于实时数据流mining的,part I比较偏理论,对构建实时数据仓库可能有帮助。part II偏实践,除了简单介绍S4,Storm等工具以外,介绍了一些流式mining的概念和思想,非学术帝们也能看得懂,不错的tutorials。 [ [微博](http://www.weibo.com/5220650532/Bueqv4tFl) ]
+
+> 2014-11-01 @BigData大数据: #BigData2014#BigData虽不能称为顶会,但是毕竟是世界第一个以BigData命名的会议,去年我在加州参加了第一届,今年第二届在DC刚刚结束,第一时间放出来干货,里面四个tutorial内容够翔实 http://t.cn/R70vcWZ 重点推荐第二个邢波Eric Xing的,他们组目前做DL和系统结合很厉害@好东西传送门 @数盟社区 [ [微博](http://www.weibo.com/2870219257/BuaHM1tsU) ]
+
+2014-11-01 Big Data Analytics Beyond Hadoop 第一章预览http://t.cn/R70aCGK 本章中作者总结了三代机器学习算法实现的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer实现基于Hadoop的扩展,第三代如Spark和Storm实现了实时和迭代数据处理。中文摘要(作者 -之诸暇)http://t.cn/RvtTFtX [ [微博](http://www.weibo.com/5220650532/BueqhsDRY) ]
+
+2014-11-01 感谢 @cvnote计算机视觉笔记 @bicloud笑西西 @52nlp @出门问问 @CSDN研发频道 [ [微博](http://www.weibo.com/5220650532/BuemD7sMQ) ]
+
+> 2014-11-01 @好东西传送门: 机器学习头条 2014-10-31 http://t.cn/R70wAaV 1)ECCV14教程:采集处理可形变的人体动物模型 2)为什么深度学习让其他机器学习算法相形见绌 3)spark上的贝叶斯学习 4)sync2014北京大会上关于人工智能方向的圆桌会议 5)@夏粉_百度 百度推荐技术论文《智能因子分解机》 加长版49条 http://t.cn/R70wAat [ [微博](http://www.weibo.com/5220650532/BubNxjrAR) ]
+
+2014-11-01 Query Intent Classification By Search Session Analysis,盛大topdata team [ [微博](http://www.weibo.com/5220650532/BudeR8qS9) ]
+
+> 2014-10-31 @清风运文: CIKM的poster总算搞定了,期待下周能在会场聆听Google Jeff Dean和微软陆奇的讲座 [ [微博](http://www.weibo.com/1527369027/Bu9ErFRDb) ]
+
+2014-11-01 IEEE BigData 2014 大数据会议 [ [微博](http://www.weibo.com/5220650532/BucU3AGbF) ]
+
+> 2014-11-01 @BigData大数据: #BigData2014#BigData虽不能称为顶会,但是毕竟是世界第一个以BigData命名的会议,去年我在加州参加了第一届,今年第二届在DC刚刚结束,第一时间放出来干货,里面四个tutorial内容够翔实 http://t.cn/R70vcWZ 重点推荐第二个邢波Eric Xing的,他们组目前做DL和系统结合很厉害@好东西传送门 @数盟社区 [ [微博](http://www.weibo.com/2870219257/BuaHM1tsU) ]
+
+2014-11-01 更正:正确的题目翻译应该是“深度学习会不会让其他机器学习算法过时?” 感谢@haohao7 纠正 //@好东西传送门: Quora值得一读的讨论:为什么深度学习让其他机器学习算法相形见绌?参与人中有Google DeepMind团队的Jack Rae [ [微博](http://www.weibo.com/5220650532/BubPP8eWK) ]
+
+> 2014-10-31 @bicloud笑西西: Will deep learning make other Machine Learning algorithms obsolete? http://t.cn/R7pJuvQ [ [微博](http://www.weibo.com/1640260361/Bu89jsvdz) ]
+
+2014-11-01 Quora值得一读的讨论:为什么深度学习让其他机器学习算法相形见绌?参与人中有Google DeepMind团队的Jack Rae [ [微博](http://www.weibo.com/5220650532/BubzpecZr) ]
+
+> 2014-10-31 @bicloud笑西西: Will deep learning make other Machine Learning algorithms obsolete? http://t.cn/R7pJuvQ [ [微博](http://www.weibo.com/1640260361/Bu89jsvdz) ]
+
+2014-10-31 spark上的贝叶斯学习,用python的pymc包 [ [微博](http://www.weibo.com/5220650532/Bu7CprXpq) ]
+
+> 2014-10-31 @52nlp: Bayesian Machine Learning on Apache Spark http://t.cn/R7p5RJX 关键词:Markov Chain Monte Carlo (MCMC) Methods, PyMC, Spark, PyMC on Spark, Topic Modeling with MCMC, Distributed LDA on Spark with PyMC [ [微博](http://www.weibo.com/2104931705/Bu7BE77Rp) ]
+
+2014-10-31 《PostgreSQL 中文资料汇总》 谭峰(@francs3 ,PostgreSQL 中文社区版主)整理,挺有用的 http://t.cn/8F4CZ9J 另外作者和黄坚将《PostgreSQL 9 Admin Cookbook》翻译成了中文 [good] http://t.cn/8FBhLZm [ [微博](http://www.weibo.com/5220650532/Bu74plHpM) ]
+
+2014-10-31 在想以后《机器学习日报》是不是该出一个专栏叫“千万别错过的讲座”,比如这个 [ [微博](http://www.weibo.com/5220650532/Bu5IS0xTr) ]
+
+> 2014-10-31 @刘知远THU: Google Senior Fellow Jeff Dean 将于下周三(11月5日)14:30在清华大学FIT大楼多功能报告厅做学术报告:Scaling Deep Learning,由 @孙茂松 教授主持。欢迎对深度学习和大规模机器学习技术感兴趣的同学来与Jeff Dean面对面。 [ [微博](http://www.weibo.com/1464484735/Bu5GPvrJR) ]
+
+2014-10-31 这个文本可视化综述是真心好,足足一百种方法,以前最多见过其中十几种 textvis.lnu.se 瑞典Linnaeus University出品 [good] [ [微博](http://www.weibo.com/5220650532/Bu5GxvOOP) ]
+
+> 2014-10-30 @AixinSG: 非常直观的文本可视化综述:Text Visualization Browser: A Visual Survey of Text Visualization Techniques http://t.cn/R79Ye47 [ [微博](http://www.weibo.com/1025887594/BtUsZ5Ntg) ]
+
+2014-10-31 好长,里面@白硕SH 老师说的那段也不错。神经网络这一轮复兴,也许能比上一轮维持得久一点。 [ [微博](http://www.weibo.com/5220650532/Bu5xmnnIZ) ]
+
+> 2014-10-31 @BigData大数据: #脑机计算#目前很多很多BRAIN,什么百度Google大脑,也有脑计划,容易把人弄糊涂,最近Jordan也跳出来说别动不动把脑扯上关系,最近科学院也出了Diannao DaDiannao, 新近 @杨静Lillian 对 @潘布衣 的专访,http://t.cn/R7NcpVb 布衣明确了一些容易混淆视听的概念 不能错过 @好东西传送门 [ [微博](http://www.weibo.com/2870219257/Bu3V8apUx) ]
+
+2014-10-31 关于Tableau和ggplot2的比较,看这条微博 http://t.cn/R7NTgi5 @海中的沙粒 [ [微博](http://www.weibo.com/5220650532/Bu5ui4JwL) ]
+
+> 2014-10-20 @数据可视化Tableau: #Tableau 8 权威指南上架# 很高兴和大家分享由我们公司员工翻译的《tableau 8 权威指南》一书,该书是目前国内最详细介绍tableau最新大版本数据可视化制作的书,全书彩印,并配有视频和示例。各大网店均有售。中国传媒大学教授博导 @沈浩老师 、北大博导袁老师 @晓如微博(名字不分先后)写序推荐! [ [微博](http://www.weibo.com/3196853784/BsrPrEzlu) ]
+
+2014-10-31 感谢 @ICTCLAS张华平博士 @十月伤感wb @中国云计算论坛 @差哥 @AixinSG 今天的长版里注意到@齐梁后尘 和@殆知阁 起的一个话题 http://t.cn/R7NL4l2 涉及到古籍整理中的自然语言处理,貌似可以发展成有趣的话题,大家可以去那里各抒己见 [ [微博](http://www.weibo.com/5220650532/Bu2sdneLn) ]
+
+> 2014-10-31 @好东西传送门: 机器学习头条 2014-10-30 http://t.cn/R7NLzFG 1)SMP2014第三届全国社会媒体处理大会手册 2)100个推荐系统相关的视频 3)数据挖掘基础:分词入门 4)四种传统的自然语言生成技术及其优缺点 5)非常直观的文本可视化综述 加长版30条 http://t.cn/R7NLzFq [ [微博](http://www.weibo.com/5220650532/Bu2qiyeBs) ]
+
+2014-10-31 机器学习头条 2014-10-30 http://t.cn/R7NLzFG 1)SMP2014第三届全国社会媒体处理大会手册 2)100个推荐系统相关的视频 3)数据挖掘基础:分词入门 4)四种传统的自然语言生成技术及其优缺点 5)非常直观的文本可视化综述 加长版30条 http://t.cn/R7NLzFq [ [微博](http://www.weibo.com/5220650532/Bu2qiyeBs) ]
+
+2014-10-30 SO上一篇很好的问答:SQL和Prolog的异同。很多人可能没有意识到,SQL其实是一种logic program(逻辑程序)。它和Prolog这类逻辑程序的区别则在于SQL主要是事实和集合(关系)引擎,而prolog是规则和推理引擎(所以可以处理“语义”)。SQL主要是服务器端语言,Prolog主要是客户端语言。http://t.cn/zjUlI3G [ [微博](http://www.weibo.com/5220650532/BtWTh7TJU) ]
+
+2014-10-30 先记这issue 311 http://t.cn/R7Ch44x 参老问题108“求推荐靠谱的自动摘要软件/服务”的初步答案http://t.cn/RPgzu6p 另外snownlp内置了一个简单的中文摘要模块http://t.cn/8kf1c3p (TextRank算法) [ [微博](http://www.weibo.com/5220650532/BtVWPeDpX) ]
+
+> 2014-10-30 @流川和他的偏见: #求助#@好东西传送门 有木有什么自动摘要的工具 我真的找了好久 …… http://t.cn/R79MNO8 [ [微博](http://www.weibo.com/2560968763/BtRjqbaiC) ]
+
+2014-10-30 W3C主席,Web发明人Tim Berners-Lee今天在w3c 20年庆典上的主题演讲http://t.cn/R79rwZe ,系统阐述了历史回顾,万维网协作,新一代的社交网络,为什么开放性极其重要和W3C的使命。@lidingpku 做了简明摘要 http://t.cn/R79rwZF [ [微博](http://www.weibo.com/5220650532/BtVkJkDXU) ]
+
+2014-10-30 很好的可视化。写篇文章讲讲是怎么做的吧 [ [微博](http://www.weibo.com/5220650532/BtVg0dxAd) ]
+
+> 2014-10-30 @规勒个划: 基于位置微博的人口流动分析(草图),原始数据约1000余万条(6天),一个星期搭建好计算框架,跑一次2小时,不过可以分步执行,哈哈 [ [微博](http://www.weibo.com/1012425625/BtUOP2e05) ]
+
+2014-10-30 感谢 @Copper_PKU @杨静Lillian @hashjoin @BigData大数据 [ [微博](http://www.weibo.com/5220650532/BtUzz9yNL) ]
+
+> 2014-10-30 @好东西传送门: 机器学习头条 2014-10-29 http://t.cn/R79Tsst 1)A Fast And Scalable Topic-Modeling Toolbox 2)交互式搜索:改变世界的百度智能界面 3)腾讯TDW千台Spark千亿节点对相似度计算 4)Jeff Dean在RecSys上主题讲演 5)Geoff Hinton演讲视频,指点DL未来走势 加长版48条 http://t.cn/R79Tssc [ [微博](http://www.weibo.com/5220650532/BtUzqAyu5) ]
+
+2014-10-30 机器学习头条 2014-10-29 http://t.cn/R79Tsst 1)A Fast And Scalable Topic-Modeling Toolbox 2)交互式搜索:改变世界的百度智能界面 3)腾讯TDW千台Spark千亿节点对相似度计算 4)Jeff Dean在RecSys上主题讲演 5)Geoff Hinton演讲视频,指点DL未来走势 加长版48条 http://t.cn/R79Tssc [ [微博](http://www.weibo.com/5220650532/BtUzqAyu5) ]
+
+2014-10-30 五种LDA方法Distributed collapsed Gibbs sampling DCGS, Asynchronous DCGS, Fast collapsed Gibbs sampling,Fast collapsed variational inference, Efficient collapsed Gibbs sampling [ [微博](http://www.weibo.com/5220650532/BtUi478w4) ]
+
+> 2014-10-29 @Copper_PKU: 重新学习Topic Model鸟 找个一个不错的合集 “A Fast And Scalable Topic-Modeling Toolbox” http://t.cn/R7KkI9O [ [微博](http://www.weibo.com/1758509357/BtPotfW08) ]
+
+2014-10-30 转发微博 [ [微博](http://www.weibo.com/5220650532/BtUbkjBNK) ]
+
+> 2014-10-29 @BigData大数据: #Jeff Dean视频#高富帅Dean,MR, Spanner, Pregel等顶级系统的首席&Google Fellow,已全面转向做深度学习,刚传了一个去年斯坦福的视频做开胃小菜,本视频是Jeff本月在RecSys上主题讲演,因时间冲突Jeff罕见缺席OSDI而去RecSys,http://t.cn/R7KyzrC @数盟社区 @好东西传送门 @杨静Lillian @龙星镖局 [ [微博](http://www.weibo.com/2870219257/BtMlfDJal) ]
+
+2014-10-29 嗯,很好的PostgreSQL网页管理工具 //@网路冷眼: 是简约,简约而不简单[酷] //@2gua: 很简洁啊 [ [微博](http://www.weibo.com/5220650532/BtL86ALD4) ]
+
+> 2014-10-28 @网路冷眼: #工具分享#【pgweb:基于Web的PostgreSQL数据管理工具】http://t.cn/R7SvBMV pgweb采用Go语言编写,能运行在Mac OS,Linux和Windows等主流平台,和MySQL数据库的管理工具phpmyadmin有异曲同工之妙。@Linux中国 @好东西传送门 @伯乐头条 [ [微博](http://www.weibo.com/1715118170/BtH3U7sa4) ]
+
+2014-10-29 感谢 @36大数据网 @李沐M @hsunway @Python开发者 @龙星镖局 @人见人爱花见花开的土豆 。昨天回答了特征学习学习资料和深度学习用于语音识别的资料的两个问题。这些问题以前都被问过,见我们的Github http://t.cn/R7oBpCz 以后我们也会提供更方便的旧文检索方式 [ [微博](http://www.weibo.com/5220650532/BtL7Q5nl3) ]
+
+> 2014-10-29 @好东西传送门: 机器学习头条 2014-10-28 http://t.cn/R7oBq2I 1)@李沐M “人工特征工程+线性模型”的尽头 2)谣言的判别方法 3)Twitter开源云环境时间序列数据断层检测工具 4)50行Python代码写一个语言检测器 5)Wiki上的人工智能史 加长版39条 http://t.cn/R7oBq2x [ [微博](http://www.weibo.com/5220650532/BtL5Xl0LK) ]
+
+2014-10-29 机器学习头条 2014-10-28 http://t.cn/R7oBq2I 1)@李沐M “人工特征工程+线性模型”的尽头 2)谣言的判别方法 3)Twitter开源云环境时间序列数据断层检测工具 4)50行Python代码写一个语言检测器 5)Wiki上的人工智能史 加长版39条 http://t.cn/R7oBq2x [ [微博](http://www.weibo.com/5220650532/BtL5Xl0LK) ]
+
+2014-10-29 #求助# 有门友问,有什么关于中文文章情感分析的资料或者工具吗? [ [微博](http://www.weibo.com/5220650532/BtHYlzMWm) ]
+
+2014-10-29 text detection是经典图像处理问题,文章很多http://t.cn/R7o9Xmh 一个常用方法是maximally stable extremal regions (MSER) http://t.cn/R7o9Xm7 http://t.cn/R7o9Xmz Andrew Ng等最近也用无监督学习方法http://t.cn/R7o9XmA [ [微博](http://www.weibo.com/5220650532/BtHRH5OWE) ]
+
+> 2014-10-28 @--_木_--: 有什么方法可以把图片上的文字区域识别出来么? 不需要文字具体内容。 主要目的是想把图片上的文字都删除或者能删多少是多少。例如这个例子。有人有思路吗? @好东西传送门 @余轶南 @星空下的巫师 @西瓜大丸子汤 [ [微博](http://www.weibo.com/1826623915/BtHcV878K) ]
+
+2014-10-28 @xccds 以前推荐过Discover Feature Engineering, How to Engineer Features and How to Get Good at It http://t.cn/RhumtBN 这篇综述了特征工程的方方面面,作为基础很不错。另外一片@breezedeus 推荐的An Introduction to Feature Selection http://t.cn/R7PEiL5 也不错,列有进阶阅读参考文献 [ [微博](http://www.weibo.com/5220650532/BtDYzeALm) ]
+
+> 2014-10-28 @蜗牛爬nj: @好东西传送门 能推荐一下关于 特征学习方面的学习资料吗?最好全面一点的 [ [微博](http://www.weibo.com/2502391724/BtDWqfPxu) ]
+
+2014-10-28 文章的Bibtex等请看issue 307 http://t.cn/R7aUymw [ [微博](http://www.weibo.com/5220650532/BtDGn3DcG) ]
+
+> 2014-10-28 @好东西传送门: @姚启鹏要茁壮 问:现在关于谣言的判别有哪些方法,有没有一些机用器学习的方法来判别? @AixinSG 推荐Mei Qiaozhu在EMNLP 2011上的文章Rumor has it: Identifying Misinformation in Microblogs http://t.cn/R7ST9Xj @QPCN 推荐过www上的识别垃圾与虚假信息的教程 http://t.cn/R7ST9XW [ [微博](http://www.weibo.com/5220650532/BtDFWrFPY) ]
+
+2014-10-28 @姚启鹏要茁壮 问:现在关于谣言的判别有哪些方法,有没有一些机用器学习的方法来判别? @AixinSG 推荐Mei Qiaozhu在EMNLP 2011上的文章Rumor has it: Identifying Misinformation in Microblogs http://t.cn/R7ST9Xj @QPCN 推荐过www上的识别垃圾与虚假信息的教程 http://t.cn/R7ST9XW [ [微博](http://www.weibo.com/5220650532/BtDFWrFPY) ]
+
+2014-10-28 基于E-Divisive with Medians(EDM)的时间序列数据断层检测工具BreakoutDetection。Twitter的原文 Breakout detection in the wild http://t.cn/R7xmnGj Github项目主页http://t.cn/R7SI17A [ [微博](http://www.weibo.com/5220650532/BtDBEwcfm) ]
+
+> 2014-10-28 @hsunway: Twitter开源云环境时间序列数据断层检测工具BreakoutDetection http://t.cn/R7SVnjt http://t.cn/R7SI17A [ [微博](http://www.weibo.com/1733873534/BtCpLeb49) ]
+
+2014-10-28 请看这条老微博:2014-08-19 [资料整理] 深度学习在语音识别的应用,入门篇: http://t.cn/RP8ll1s 向 @李开复 在CMU做的Sphinx(1988)致敬。介绍几个牛人和顶级团队: 微软 (邓力 Li Deng )和谷歌 (Vincent Vanhoucke, Geoffrey E. Hinton) http://t.cn/R7SfRJ1 [ [微博](http://www.weibo.com/5220650532/BtClC82OQ) ]
+
+> 2014-10-28 @Syndrome_suf: @好东西传送门 @我爱机器学习 @微软亚洲研究院 各位亲爱的大大,请问deep learning应用于语音识别的经典论文有哪些啊?[得意地笑][得意地笑] [ [微博](http://www.weibo.com/1762713024/BtCcgEH8a) ]
+
+2014-10-28 推荐。如果要看短的有AI Landscape http://t.cn/RhTXnDF 和AI Timeline http://t.cn/R7asDqM [ [微博](http://www.weibo.com/5220650532/BtzS9jxNo) ]
+
+> 2014-10-28 @龙星镖局: Wiki上的人工智能史 稍长一些 并且是中文的 更适合大家读 读后不得不叹 人工智能激荡几十年啊 有一句词评价AI很适合:向来回首萧瑟处,归去,也无风雨也无晴 | 我爱计算机 @52cs @好东西传送门 @老师木 http://t.cn/R7ag4f6 [ [微博](http://www.weibo.com/1830516311/BtyUMDJJD) ]
+
+2014-10-28 传送门看了一遍,表示同意右边意见。作者(Eren Golge)的机器学习工作流系列文章都不错 http://t.cn/R7asuLU //@phunter_lau: 很好,比较细致全面涵盖了特征工程这一脏活累活的诸多方面 [ [微博](http://www.weibo.com/5220650532/BtzQgiLY3) ]
+
+> 2014-10-27 @星空下的巫师: ML Work-Flow (Part 3) - Feature Extraction - A Blog From a Human-engineer-being http://t.cn/R7aQPbR [ [微博](http://www.weibo.com/1785748853/BtxMWwGjQ) ]
+
+2014-10-28 感谢 @研究者July @王利锋Fandy @火光摇曳Flickering @BigData大数据 @刘洋THU 头条之外今天还有不少好内容,如52nlp推荐的几种语言常用的机器学习工具包,Kenneth Kuttler的电子书线性代数理论与应用, 李航老师的《Learning to Rank》第二版等 [ [微博](http://www.weibo.com/5220650532/BtzNItsjg) ]
+
+> 2014-10-28 @好东西传送门: 机器学习头条 2014-10-27 http://t.cn/R7asKVK 1)最大熵模型中的数学推导 2)word2vec笔记之基础篇、算法篇和应用篇(falao_beiliu) 3)SparseLDA算法 4)Mining Big Data with Apache Spark - Reynold Xin 5)中文计算语言学会议CCL& NLP-NABD 2014论文集可下载 加长版52条 http://t.cn/R7asKV9 [ [微博](http://www.weibo.com/5220650532/BtzMgCKRI) ]
+
+2014-10-28 机器学习头条 2014-10-27 http://t.cn/R7asKVK 1)最大熵模型中的数学推导 2)word2vec笔记之基础篇、算法篇和应用篇(falao_beiliu) 3)SparseLDA算法 4)Mining Big Data with Apache Spark - Reynold Xin 5)中文计算语言学会议CCL& NLP-NABD 2014论文集可下载 加长版52条 http://t.cn/R7asKV9 [ [微博](http://www.weibo.com/5220650532/BtzMgCKRI) ]
+
+2014-10-28 常见语言的机器学习包一览 [ [微博](http://www.weibo.com/5220650532/BtzeKcm2I) ]
+
+> 2014-10-27 @52nlp: Open source tools make it easier to integrate machine learning into apps written in Java, 5 ways to add machine learning to Java, JavaScript, and more http://t.cn/R7a0FKR 提到了几种语言常用的机器学习工具包, 譬如scikit-learn, PyBrain, GoLearn, Mahout, Weka, Java-ML, ConvNetJS等 [ [微博](http://www.weibo.com/2104931705/Btxj9mJOe) ]
+
+2014-10-27 回复@新蝾螈:不能下载的可以试试右边提到的链接//@新蝾螈:貌似不能下载。但这个行:http://t.cn/R7aVqCp, 有这本书,课程大纲还有习题答案... [ [微博](http://www.weibo.com/5220650532/BtxQs1X0O) ]
+
+> 2014-10-27 @好东西传送门: Brigham Young University的Kenneth Kuttler把自己的《Linear Algebra, Theory And Applications》(线性代数理论与应用)全书pdf放在网上了, 500页,很数学,比Strang那本Introduction to Linear Algebra要深一些 [ [微博](http://www.weibo.com/5220650532/BtvFKbzLD) ]
+
+2014-10-27 这是链接 http://t.cn/R7aGZ0H [ [微博](http://www.weibo.com/5220650532/BtvH5etwv) ]
+
+> 2014-10-27 @好东西传送门: Brigham Young University的Kenneth Kuttler把自己的《Linear Algebra, Theory And Applications》(线性代数理论与应用)全书pdf放在网上了, 500页,很数学,比Strang那本Introduction to Linear Algebra要深一些 [ [微博](http://www.weibo.com/5220650532/BtvFKbzLD) ]
+
+2014-10-27 Brigham Young University的Kenneth Kuttler把自己的《Linear Algebra, Theory And Applications》(线性代数理论与应用)全书pdf放在网上了, 500页,很数学,比Strang那本Introduction to Linear Algebra要深一些 [ [微博](http://www.weibo.com/5220650532/BtvFKbzLD) ]
+
+2014-10-27 又想起来@QPCN 香港城市大学的教授,社交网络研究新星 @立委_米拉 在美国工作的自然语言处理老兵,常能从统计角度之外提出有营养的看法。 [ [微博](http://www.weibo.com/5220650532/BtvyDjiKf) ]
+
+> 2014-10-25 @好东西传送门: 中文计算机领域几个潜力股微博帐号: @Gary南京 知识和逻辑国内最重要的教授之一 @昊奋 学贯统计与知识两界,研究与工程经验都十分扎实 @AixinSG 执教新加坡,机器学习社交网络信息检索 @phunter_lau 推荐系统专家,而且有趣。当然其他大牛很多,这几个是关注的人还不算多,但绝对不该错过的。 [ [微博](http://www.weibo.com/5220650532/BtdjfEuRo) ]
+
+2014-10-27 转发这条是真的觉得《Python计算机视觉编程》不错。英文版原书Programming Computer Vision with Python http://t.cn/zWUbqfY 作者放出来的电子版 http://t.cn/R7a2D3Y [ [微博](http://www.weibo.com/5220650532/Btvlif0OY) ]
+
+> 2014-10-27 @图灵社区: #电子书本周半价# 《Python计算机视觉编程》http://t.cn/RvnpQRY 《世界顶级创业导师的洞见》http://t.cn/RvejK6O [ [微博](http://www.weibo.com/2526195981/BtviMxPdU) ]
+
+2014-10-27 初学者问题:如何在机器学习的语境下能达到有坚实的数学基础? 讨论见 http://t.cn/RPlPk6o @刘赛的中国梦 提到《数据挖掘中的新方法-支持向量机》(邓乃扬) 读了这本书再读 @李航博士 《统计学习方法》就会比较容易了。此外CMU等名校的机器学习课程都列有前提要求,可资参考 [ [微博](http://www.weibo.com/5220650532/Btv9Nuvqd) ]
+
+2014-10-27 Learning to Rank 第二版。这里以前我们收集的40多条LTR的资料,包括第一版的Google Books预览 http://t.cn/RP5WYnc [ [微博](http://www.weibo.com/5220650532/Btv3M3Yeh) ]
+
+> 2014-10-27 @刘知远THU: @李航博士 老师的专著《Learning to Rank for Information Retrieval and Natural Language Processing》出第二版了,关注。http://t.cn/R7ahdDU [ [微博](http://www.weibo.com/1464484735/BtuXxvnVG) ]
+
+2014-10-27 Reynold Xin @hashjoin http://t.cn/R7Xrqqa http://t.cn/zjLlNrX "大胡子小弟" Aaron Davidson http://t.cn/R7XrqqS [ [微博](http://www.weibo.com/5220650532/BtufWmvMc) ]
+
+> 2014-10-27 @BigData大数据: #Spark视频#Reynold Xin公开演讲视频,作为DataBricks的联合FOUNDER,很少接受演讲邀请,甚至在Spark Summit China 2014 和Spark Summit 2014都不发声,这次在Data Mining Meetup中终于闻其声,带着一个大胡子小弟一起演示,有兴趣的听一下。视频地址:http://t.cn/R7X00Ns @hashjoin @好东西传送门 [ [微博](http://www.weibo.com/2870219257/BttdteqpM) ]
+
+2014-10-27 感谢 @Jay_GraphLab @王威廉 @研究者July @高松-GISer @KissDev [ [微博](http://www.weibo.com/5220650532/BtsJM0psi) ]
+
+> 2014-10-27 @好东西传送门: 机器学习头条 2014-10-26 http://t.cn/R7XaMxI 1)什么R和Python的用户值得尝试GraphLab Create 2)中文微博的依存句法分析 3)邹博的PPT教程:回归与最优化,最大熵模型 4)用条件概率模型估计全球机场埃博拉病毒传染风险 5)计算广告学斯坦福和 @北冥乘海生 的入门课程 加长版41条 http://t.cn/R7XaMxx [ [微博](http://www.weibo.com/5220650532/BtsI5oBIJ) ]
+
+2014-10-27 机器学习头条 2014-10-26 http://t.cn/R7XaMxI 1)什么R和Python的用户值得尝试GraphLab Create 2)中文微博的依存句法分析 3)邹博的PPT教程:回归与最优化,最大熵模型 4)用条件概率模型估计全球机场埃博拉病毒传染风险 5)计算广告学斯坦福和 @北冥乘海生 的入门课程 加长版41条 http://t.cn/R7XaMxx [ [微博](http://www.weibo.com/5220650532/BtsI5oBIJ) ]
+
+2014-10-27 握手!Linux下的矢量编辑,Skencil也很好用,而且是用Python写的 http://t.cn/h4Fphj EPS转化的话,Linux下最好用的是convert命令(ImageMagick的一部分): convert foo.png foo.eps http://t.cn/aouUYB [ [微博](http://www.weibo.com/5220650532/BtqEB2Tb4) ]
+
+> 2014-10-26 @AixinSG: 多谢@好东西传送门 推荐,见识了社交媒体上推荐的力量,一下子涨了几百粉。下一步好好看看推荐系统的东西。 顺便推荐 Inkscape, 一个很强大的开源矢量图编辑软件,我只用它一个功能,把各种图片转成EPS, 用Latex写文章的可能会用得着 [ [微博](http://www.weibo.com/1025887594/Btk4l8YKQ) ]
+
+2014-10-27 12年UCLA Summer School《深度学习和特征学习》 [ [微博](http://www.weibo.com/5220650532/BtpPH83mm) ]
+
+> 2014-10-26 @龙星镖局: 12年UCLA Summer School的主题是《深度学习和特征学习》,报告者有Hinton、LeCun、 Ng 、 Bengio、Weston 和@余凯_西二旗民工 等一线大牛。讲座PPT和视频都可以在http://t.cn/R7JRbhv 下载观看。@breezedeus @好东西传送门 @developerWorks [ [微博](http://www.weibo.com/1830516311/BtmYiB4cO) ]
+
+2014-10-26 回复@kingkg28-zhou: 不需要,有一点设计网页的经验最好,帮网站参谋一下网页的排版设计,然后每周在周报发出去之前帮着看一眼是不是有不妥或重复,应该10-20分钟就够了。内容都会在Github上发布 http://t.cn/RPfAgNg //@kingkg28-zhou:需要专业基础吗? [ [微博](http://www.weibo.com/5220650532/BtlH451OK) ]
+
+> 2014-10-26 @好东西传送门: http://t.cn/R76cfVx 刚刚发了上周的《好东西周报》。上周我们共推荐了87次好东西,最热门前十条见长微博。BTW, 《好东西周报》的网站需要一个志愿者,这个工作会是开源的,有门友感兴趣吗?在这条微博下留言或私信都可以 [ [微博](http://www.weibo.com/5220650532/BtlELCfsn) ]
+
+2014-10-26 http://t.cn/R76cfVx 刚刚发了上周的《好东西周报》。上周我们共推荐了87次好东西,最热门前十条见长微博。BTW, 《好东西周报》的网站需要一个志愿者,这个工作会是开源的,有门友感兴趣吗?在这条微博下留言或私信都可以 [ [微博](http://www.weibo.com/5220650532/BtlELCfsn) ]
+
+2014-10-26 //@龙星镖局: @刘知远THU @刘挺 @AixinSG @白硕SH @Bing_Liu_25 @黄亮-算法时代 这个材料值得nlp的童鞋看看,请大家扩散一下[呵呵] [ [微博](http://www.weibo.com/5220650532/Btlt4vaEl) ]
+
+> 2014-10-25 @龙星镖局: 做自然语言处理和语音识别的都应该看看大牛 Kevin Duh 的这个资料《语言的世界》(英文题目是 Languages of the World),http://t.cn/R7i2Jvj 。他从语言的定义、起源、发展、各语系的分类、特点、差异等方面对要“语言”进行了认识。如果你对所要解决的问题都没有认识,何谈研究呢? [ [微博](http://www.weibo.com/1830516311/BteMrhtLx) ]
+
+2014-10-26 http://t.cn/R76vke8 @龙星镖局 推荐:Kevin Duh 《Languages of the World》(语言的世界)。Duh是奈良尖端科学技术大学院大学助理教授,从事自然语言处理与机器学习。这个PPT里他简要介绍了世界各大语言的谱系,和它们的一些语言特征。交互式世界语言地图网站请看WALS http://t.cn/zOJbnFn [ [微博](http://www.weibo.com/5220650532/BtkuG1txH) ]
+
+2014-10-26 推荐coursera上现在的一门课Automata(自动机),主讲人斯坦福Jeff Ullman(名教材Dragon Book和Cinderella book的作者)讲了计算复杂性和可计算性的一些入门基础问题,如图灵机,上下文无关文法,NP完全问题等 http://t.cn/zOSSPKE [ [微博](http://www.weibo.com/5220650532/Btjv1xmpx) ]
+
+2014-10-26 论文直达传送门 http://t.cn/R7iEt4z 交互式demo传送门 http://t.cn/R7iEt4h 用的是很基础的贝叶斯概率。 [ [微博](http://www.weibo.com/5220650532/BtjplisEg) ]
+
+> 2014-10-26 @高松-GISer: #关注埃博拉# 德国复杂系统研究小组Brockmann Lab利用全球航空网络和航空客流数据、根据条件概率模型估计了各机场和全球各大区域的病毒传染风险指数。把结果利用D3+JS Web可视化表达出来 http://t.cn/R7iXyFU [ [微博](http://www.weibo.com/1638623287/BtgEylClD) ]
+
+2014-10-26 这本书的v1有简体中文版 http://t.cn/R7iHHIa 解释繁略得当,例子实用。第二版大大扩展了Git Tools,新增Github一章,比第一版更能帮助大家少走弯路 [ [微博](http://www.weibo.com/5220650532/Btj5Sdr1t) ]
+
+> 2014-10-25 @网路冷眼: #干货分享#【免费的电子书Pro Git发布2.0】http://t.cn/R7izIzo Git方面最重要采用共享协议的电子书发布英文第2版,提供PDF, mobi和ePub三种格式免费下载 。1.0有中文在线版本。[doge]@2gua 请收深夜福利!cc @好东西传送门 @伯乐头条 @孢子响马 @极客头条 @developerWorks [ [微博](http://www.weibo.com/1715118170/Btfo60pID) ]
+
+2014-10-26 感谢 @KissDev @包云岗 @bruinxiong 特别是 @龙星镖局 昨天一口气推荐了好几个好资源,除了头条里这条还有深度学习干货集,Mehryar Mohri《Foundations of Machine Learning》Jordan《On the Computational and Statistical Interface and Big Data》 [ [微博](http://www.weibo.com/5220650532/Btj2cpiJo) ]
+
+> 2014-10-26 @好东西传送门: 机器学习头条 2014-10-25 http://t.cn/R7iTf3f 1)Kevin Duh 《语言的世界》 2)数据科学领域酷的免费数据集 3)LinkedIn工程师:面向搜索的大规模机器学习 4)@陈云霁 等:机器学习超级计算机DaDianNao 5)胡哲:从CVPR 2014看计算机视觉领域的最新热点 加长版56条 http://t.cn/R7iTf3V [ [微博](http://www.weibo.com/5220650532/BtiYktmcm) ]
+
+2014-10-26 机器学习头条 2014-10-25 http://t.cn/R7iTf3f 1)Kevin Duh 《语言的世界》 2)数据科学领域酷的免费数据集 3)LinkedIn工程师:面向搜索的大规模机器学习 4)@陈云霁 等:机器学习超级计算机DaDianNao 5)胡哲:从CVPR 2014看计算机视觉领域的最新热点 加长版56条 http://t.cn/R7iTf3V [ [微博](http://www.weibo.com/5220650532/BtiYktmcm) ]
+
+2014-10-26 潜力股+1 最右PayPal数据科学负责人。欢迎大家继续推荐! //@phunter_lau: 我推荐右边,你点了这片文章就会乖乖回来关注他的 http://t.cn/RhDrpIl //@丁磊-data: 膜拜 [ [微博](http://www.weibo.com/5220650532/Btge5tkSC) ]
+
+> 2014-10-25 @好东西传送门: 中文计算机领域几个潜力股微博帐号: @Gary南京 知识和逻辑国内最重要的教授之一 @昊奋 学贯统计与知识两界,研究与工程经验都十分扎实 @AixinSG 执教新加坡,机器学习社交网络信息检索 @phunter_lau 推荐系统专家,而且有趣。当然其他大牛很多,这几个是关注的人还不算多,但绝对不该错过的。 [ [微博](http://www.weibo.com/5220650532/BtdjfEuRo) ]
+
+2014-10-25 摘要:Devavrat Shah和Kang Zhang从各大Bitcoin交易所收集了五个月的价格数据,利用“Bayesian regression”来预测价格 [ [微博](http://www.weibo.com/5220650532/Btfknv8Jm) ]
+
+> 2014-10-25 @网路冷眼: 【麻省理工学院科学家能够预测比特币价格】http://t.cn/R7xOxQt 麻省理工学院计算机科学和人工智能实验室和信息和决策系统实验室研究人员最近开发出机器学习算法,可以预测比特币的价格波动,50天时间内这个团队使投资翻番。 [威武] @好东西传送门 [ [微博](http://www.weibo.com/1715118170/Bt9lDdkpp) ]
+
+2014-10-25 Dileep Bhandarkar, IEEE Fellow. Amazing Journey From Mainframes To Smartphones 原文是pdf [ [微博](http://www.weibo.com/5220650532/BtfiIlprC) ]
+
+> 2014-10-25 @effectivewang: Computer History这个不错 http://t.cn/R7i2b13 高通VP讲芯片历史 @好东西传送门 [ [微博](http://www.weibo.com/1801673705/BteLInxSS) ]
+
+2014-10-25 中文计算机领域几个潜力股微博帐号: @Gary南京 知识和逻辑国内最重要的教授之一 @昊奋 学贯统计与知识两界,研究与工程经验都十分扎实 @AixinSG 执教新加坡,机器学习社交网络信息检索 @phunter_lau 推荐系统专家,而且有趣。当然其他大牛很多,这几个是关注的人还不算多,但绝对不该错过的。 [ [微博](http://www.weibo.com/5220650532/BtdjfEuRo) ]
+
+2014-10-25 //@昊奋:要了解更多schema.org的质量和语义等,可以挪步iswc2014 peter的analyzing schema.org,以及chris bizer对于lod和schema.org的全面比较 [ [微博](http://www.weibo.com/5220650532/BtdfehmmW) ]
+
+> 2014-10-24 @Gary南京: google跟facebook在KDD2014关于知识图谱的一个比较全面的介绍,值得看看:http://t.cn/R7IDq3E [ [微博](http://www.weibo.com/2784224080/BsZkfdlQD) ]
+
+2014-10-25 Python日报 2014-10-24 http://t.cn/R7JEphe 比较新颖的有@ARGV 推荐的pygrok正则表达式包 @Python开发者 推荐的pycrumbs 可以和更新的Awesome Python参照着看 http://t.cn/RvmZMyi Pypi更新里有一个新的任务队列工具WorQ。Python日报近期还会改版,增加更丰富的内容。 [ [微博](http://www.weibo.com/5220650532/Btdaok9SC) ]
+
+2014-10-25 @陆浑戎 @设定控 @殆知阁 几位文史类的资源帝,有人问能不能找到49年以前的《南洋学报》,你们有没有印象或者线索? [ [微博](http://www.weibo.com/5220650532/BtcahsUR2) ]
+
+2014-10-25 //@李航博士: 强烈推荐#WSDM2015#的主题报告。你可能不知道Michael Franklin,但了解Spark;你可能没听说过Thorsten Joachims,但用过SVMLight;你也许不知晓Lada Adamic,但耳闻过Information Diffusion。尚有更过精彩的内容即将公布。 [ [微博](http://www.weibo.com/5220650532/Btc6WjbEi) ]
+
+> 2014-10-25 @WSDM2015: WSDM 2015邀请了数据科学领域的三位大牛来做主题报告:分别是Facebook的Lada Adamic,UC Berkeley的Michael Franklin,和Cornell的Thorsten Joachims。详细介绍:http://t.cn/R7Jyy0g [ [微博](http://www.weibo.com/5144018575/BtaF5pIgr) ]
+
+2014-10-25 请看以前的两条问答:《智能问答系统:心得点评与文献列表》 http://t.cn/R7JfGkY 《现今有哪些成功的智能问答系统》http://t.cn/R7JfGkQ 还有最近 @沈李斌NLP 的《问答系统中的知识图谱》http://t.cn/R7JfGkT [ [微博](http://www.weibo.com/5220650532/Btbkbbjx3) ]
+
+> 2014-10-25 @tornadomeet: @好东西传送门 帮找一些问答系统的好资料,ths. [ [微博](http://www.weibo.com/1750766782/Btb9mnFZt) ]
+
+2014-10-25 感谢 @星空下的巫师 @52nlp @Surah_Li @数盟社区 @Gary南京 今天的邮件继续测试发送了长版。不知道大家在阅读时间,打开速度,排版方面有什么意见?欢迎在下面留言告诉我。 [ [微博](http://www.weibo.com/5220650532/Bt8Rjy80c) ]
+
+> 2014-10-25 @好东西传送门: 机器学习头条 2014-10-24 http://t.cn/R7xuJTA 1)R语言的SVM教程 2)用 IBM Watson和Bluemix构造问答系统的详解 3)Robert Tibshirani讲Lasso应用于癌症检测PPT 4)机器学习中的范数规则化:L0、L1与L2范数 5)KDD2014上的知识图谱介绍 加长版45条 http://t.cn/R7xuJT2 [ [微博](http://www.weibo.com/5220650532/Bt8QEshPl) ]
+
+2014-10-25 机器学习头条 2014-10-24 http://t.cn/R7xuJTA 1)R语言的SVM教程 2)用 IBM Watson和Bluemix构造问答系统的详解 3)Robert Tibshirani讲Lasso应用于癌症检测PPT 4)机器学习中的范数规则化:L0、L1与L2范数 5)KDD2014上的知识图谱介绍 加长版45条 http://t.cn/R7xuJT2 [ [微博](http://www.weibo.com/5220650532/Bt8QEshPl) ]
+
+2014-10-25 问:有没有好用的python的excel工具库?答:功能文档都较全的有python-pptx 和openpyxl 这两个支持读写,创建电子表格。另外以读为主的有python-xlsx pyXLSX 转化excel为csv的有xlsx2csv 。当然也可以先转化excel为csv,用csv或unicodecsv包来处理。链接都在 http://t.cn/R7x8C4y [ [微博](http://www.weibo.com/5220650532/Bt851Bj3Q) ]
+
+2014-10-25 补充Michael Jordan原文 Why Big Data Could Be a Big Fail -- IEEE Spectrum http://t.cn/R7tmf96 . 乐村吐槽说Hinton是那种人,总想从生物学合理的角度理解大脑怎么工作,最后总是搞出来有点用但其实生物上并不靠谱的东西 [ [微博](http://www.weibo.com/5220650532/Bt7TPdJDj) ]
+
+> 2014-10-24 @张本宇: Yann LeCun关于Michael Jordan关于deep learning的IEEE访谈的Facebook长贴:http://t.cn/R7x6OAF,有访谈编辑的反驳,有大神Hilton的躺枪,有Jordan新博客的传送门。各种欢乐。@好东西传送门 [ [微博](http://www.weibo.com/1947318904/Bt5I2l1TL) ]
+
+2014-10-25 不错 [ [微博](http://www.weibo.com/5220650532/Bt7380fc7) ]
+
+> 2014-10-24 @whiteath: 一个小时的演讲,涵盖了很多python的特性 // A Few of My Favorite [Python] Things http://t.cn/R7xP6gQ [ [微博](http://www.weibo.com/1913607345/Bt3YZCowT) ]
+
+2014-10-24 osdi(操作系统设计与实现大h大会)全部视频 [ [微博](http://www.weibo.com/5220650532/Bt2iJpUNZ) ]
+
+> 2014-10-24 @BigData大数据: #OSDI2014#OSID http://t.cn/RPNqTrv 已经放出来全部讲演的视频,这次效率无比高,第一先推荐 Parameter Server 真心话讲,这次@李沐M 的英文比上次刚回美国暑期学校的英文听起来舒服多了,正如自己说的:还是北京待久了不会说英文了[嘻嘻] [ [微博](http://www.weibo.com/2870219257/Bt24N6fBl) ]
+
+2014-10-24 转发微博 [ [微博](http://www.weibo.com/5220650532/Bt2eKmeNU) ]
+
+> 2014-10-24 @陈天奇怪: 推荐一下之我们和@李航博士 @鲁东东胖 的ICDM论文:) A Parallel and Efficient Algorithm for Learning to Match http://t.cn/R7MolL6 。一般推荐等匹配问题的state-of-art都是基于特征的矩阵分解模型,但是这类模型很难并行化。我们的工作解决了基于特征的匹配模型的并行化问题 [ [微博](http://www.weibo.com/2397265244/Bt1SS4UZi) ]
+
+2014-10-24 机器学习头条 2014-10-23 http://t.cn/R7MPNz6 1)gradient boosting的tutorial 2)知识图谱PPT: 语义网上的本体推理by漆桂林 3)知识图谱PPT: 垂直知识图谱构造工具与行业应用by阮彤 4)Java NLP工具包RainbowNLP 5)Python的从文本学习模板的小工具templatemaker 加长版29条 http://t.cn/R7MPNza [ [微博](http://www.weibo.com/5220650532/Bt2dRolim) ]
+
+2014-10-24 回复@战术核显英伟达: 是的,所有的微博都回来了。而且我们以后会更积极地备份历史数据到Github上。只要是好东西,就永远不能让它消失 http://t.cn/RPfAgNg //@战术核显英伟达:问下所有微博都恢复了么? [ [微博](http://www.weibo.com/5220650532/Bt26uih0q) ]
+
+> 2014-10-24 @好东西传送门: 朋友们,我回来了!过去这一天多谢好多朋友关心和帮助,在此一并谢过! [ [微博](http://www.weibo.com/5220650532/Bt239afdZ) ]
+
+2014-10-24 朋友们,我回来了!过去这一天多谢好多朋友关心和帮助,在此一并谢过! [ [微博](http://www.weibo.com/5220650532/Bt239afdZ) ]
+
+2014-10-23 感谢 @网路冷眼 @张颖峰 @龙星镖局 @梁斌penny @王威廉 今天继续做了版式的调整,以平衡不同读者对短版和长版需求的差异。以前的短版现在作为今日焦点放在最前面。没有时间的读者可以只看这5条。如果对目前的长版有更多建议,欢迎大家回信hao@memect.com, 谢谢! [ [微博](http://www.weibo.com/5220650532/BsRphENEq) ]
+
+> 2014-10-23 @好东西传送门: 机器学习头条 2014-10-22 http://t.cn/R7fUQm6 1)John Hopcroft《Foundations of Data Science》 2)利用SIMD加速做索引压缩 3)Google Youtube团队公开了一个Multiview Video Game的数据 4)CMU TwitterNLP: Twitter自然语言处理 5)学习算法的Neural Turing Machine 加长版62条 http://t.cn/R7fUQmX [ [微博](http://www.weibo.com/5220650532/BsQ8toM8Q) ]
+
+2014-10-23 今天@连城404 推荐了q,一个用SQL处理文本数据的残暴工具。小门再推荐一个同样残暴的OrientDB,可以用SQL查询JSON。安装很简单,下载zip后解压就可以起服务器。可以从python/java/ruby等各种语言调用。http://t.cn/R7f6XJ9 有REST接口,和jq/httpie等综合使用可以实现命令行上更复杂的数据查询 [ [微博](http://www.weibo.com/5220650532/BsRlAmfyT) ]
+
+2014-10-23 好东西,转给搞生物信息学的伙伴们 [ [微博](http://www.weibo.com/5220650532/BsRgWAtrk) ]
+
+> 2014-10-22 @bitslife: 从2014美国人类遗传学学会的介绍中了解到了NextCODE, (1)、 Big Data及其Knowledge Base: 350,000 全基因组,40M变异注释。 (2)、 平台服务了 350 多篇高质量论文 (3)、 合作、共享基因组信息全球实时系统。(4)、 基因组数据分析流程(Alignment, Mapping, SNP/INDEL Calling) [ [微博](http://www.weibo.com/1895047203/BsMTQ6DOf) ]
+
+2014-10-23 Python头条 2014-10-22 http://t.cn/R7fMgzf 1)慕课网Python入门课程 2)Python状况:为什么PyPy是Python的未来? 3)一行代码伪装成浏览器 4)Python程序的Learning to Execute 加长版9条 http://t.cn/R7fMFzg 感谢 @慕课网 @Python开发者 @王威廉 [ [微博](http://www.weibo.com/5220650532/BsR8lujnY) ]
+
+2014-10-23 问:哪里有每日新闻联播要点总结? 答:新闻联播文字版在CNTV官网上就有 http://t.cn/R7fIsnP 每条新闻下面都有文本。CNTV之前CCTV上也有 例如 http://t.cn/R7fIsnv 时事一点通的《时事新闻日报道》》有每日总结, http://t.cn/a8fwZM 分国内国际,都有简短的摘要。这些都是很好的语料库。 [ [微博](http://www.weibo.com/5220650532/BsR7o7CRX) ]
+
+2014-10-23 感谢 @网路冷眼 @张颖峰 @龙星镖局 @梁斌penny @王威廉 今天继续做了版式的调整,以平衡不同读者对短版和长版需求的差异。以前的短版现在作为今日焦点放在最前面。没有时间的读者可以只看这5条。如果对目前的长版有更多建议,欢迎大家回信hao@memect.com, 谢谢! [ [微博](http://www.weibo.com/5220650532/BsQ8R3r5k) ]
+
+> 2014-10-23 @好东西传送门: 机器学习头条 2014-10-22 http://t.cn/R7fUQm6 1)John Hopcroft《Foundations of Data Science》 2)利用SIMD加速做索引压缩 3)Google Youtube团队公开了一个Multiview Video Game的数据 4)CMU TwitterNLP: Twitter自然语言处理 5)学习算法的Neural Turing Machine 加长版62条 http://t.cn/R7fUQmX [ [微博](http://www.weibo.com/5220650532/BsQ8toM8Q) ]
+
+2014-10-23 机器学习头条 2014-10-22 http://t.cn/R7fUQm6 1)John Hopcroft《Foundations of Data Science》 2)利用SIMD加速做索引压缩 3)Google Youtube团队公开了一个Multiview Video Game的数据 4)CMU TwitterNLP: Twitter自然语言处理 5)学习算法的Neural Turing Machine 加长版62条 http://t.cn/R7fUQmX [ [微博](http://www.weibo.com/5220650532/BsQ8toM8Q) ]
+
+2014-10-23 一个Python的从文本学习模板的小工具 templatemaker http://t.cn/R7fyt3x 可以从一堆输入样板句子中提取他们的不变部分,然后利用模板可以做匹配检查,成分提取等。对清理Web数据,简单的模式学习超级有用 [ [微博](http://www.weibo.com/5220650532/BsPVLCQS5) ]
+
+2014-10-23 爬虫相关资料(Java ).pdf 一组挺有用的链接 [ [微博](http://www.weibo.com/5220650532/BsPkvtPv4) ]
+
+> 2014-10-22 @睡眼惺忪的小叶先森: 这几天很多筒子不约而同让我提供几个编写爬虫的资料[doge]。我把我过去参考过的,整理了一下,包含了开源框架以及自己手动编写爬虫所需工具,还包括了信息抽取等。Java版本的。http://t.cn/R7VVttV @好东西传送门 @囧囧有神的小杜霉女 @whiteath [ [微博](http://www.weibo.com/2765244861/BsKmhpxJn) ]
+
+2014-10-23 好文章,为什么svm在文本上应该用线性核。思考:那用与它等价的感知器是不是也可以?//@神经元NL:中心:文本大部分线性可分;文本本身特征多,映射到太高维度也没用;线性核快;线性核更好优化 [ [微博](http://www.weibo.com/5220650532/BsO9cgH96) ]
+
+> 2014-10-22 @星空下的巫师: Linear Kernel: Why is it recommended for text classification ? http://t.cn/R7V3WUA [ [微博](http://www.weibo.com/1785748853/BsMLtezwh) ]
+
+2014-10-23 Python写的内存数据处理工具,很适合做小文本的命令行查询。//@黄涧石:好东西 [ [微博](http://www.weibo.com/5220650532/BsO7edz6i) ]
+
+> 2014-10-22 @连城404: 这个叫q的工具太残暴了,在Shell下用SQL查询各种表格状的文本文件 http://t.cn/R7VntHd q "SELECT COUNT(*) FROM ./clicks_file.csv WHERE c3 > 32.3" [ [微博](http://www.weibo.com/1883627565/BsMvGfC4L) ]
+
+2014-10-23 右边一般不夸人的,被他表扬的肯定不错 →_→//@phunter_lau:涵盖的很全面啊还比一般介绍的有一定深度 //@网路冷眼:作者John Hopcroft,康奈尔大学计算机科学系教授,1986年由于在算法及数据结构设计和分析方面的基础性成就,被授予图灵奖: http://t.cn/R7VnfUX [ [微博](http://www.weibo.com/5220650532/BsO5452xI) ]
+
+> 2014-10-22 @网路冷眼: 微软发布<数据科学基础(Foundations of Data Science)>电子书,PDF格式,下载地址:http://t.cn/R7cdbab 转需!@52nlp @好东西传送门 [ [微博](http://www.weibo.com/1715118170/BsMeH8tps) ]
+
+2014-10-23 //@网路冷眼:作者John Hopcroft,康奈尔大学计算机科学系教授,1986年由于在算法及数据结构设计和分析方面的基础性成就,被授予图灵奖:http://t.cn/R7VnfUX [ [微博](http://www.weibo.com/5220650532/BsNVu9cJy) ]
+
+> 2014-10-22 @网路冷眼: 微软发布<数据科学基础(Foundations of Data Science)>电子书,PDF格式,下载地址:http://t.cn/R7cdbab 转需!@52nlp @好东西传送门 [ [微博](http://www.weibo.com/1715118170/BsMeH8tps) ]
+
+2014-10-22 @老齐Py @中国云计算论坛 @Python开发者 @朝花夕拾录 为我们提供了好资源。昨天有人反映太长,所以今天加上了5条摘要,和用长微博发布的短版。欢迎大家继续提建议 [ [微博](http://www.weibo.com/5220650532/BsJECoqiR) ]
+
+> 2014-10-22 @好东西传送门: Python头条 2014-10-21 http://t.cn/R7V2o2a 1)[零基础学python]使用tornado表单和模板 2)clint:Python命令行工具 3)用python + hadoop编写分布式程序 4)matplotlib: 使用Python进行图表绘图 5)Writing C in Cython 加长版12条 http://t.cn/R7V2o2X [ [微博](http://www.weibo.com/5220650532/BsJDWrMar) ]
+
+2014-10-22 Python头条 2014-10-21 http://t.cn/R7V2o2a 1)[零基础学python]使用tornado表单和模板 2)clint:Python命令行工具 3)用python + hadoop编写分布式程序 4)matplotlib: 使用Python进行图表绘图 5)Writing C in Cython 加长版12条 http://t.cn/R7V2o2X [ [微博](http://www.weibo.com/5220650532/BsJDWrMar) ]
+
+2014-10-22 用python Requests爬网页的常用技巧: 一行代码伪装成浏览器 r = requests.post(url, headers={'user-agent: 'Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0'} ) 其他user-agent字符串 http://t.cn/hGTZFY requests库的用法 http://t.cn/R7VZfcY @Serena_pancakes [ [微博](http://www.weibo.com/5220650532/BsJrz42Ke) ]
+
+2014-10-22 车牌数据集(二)果然有好人Andrew McGill 整理上传2012年数据 有篇博文 http://t.cn/R7Vz75l 也有数据Github CSV 70M http://t.cn/R7Vz75j //@核桃街魔女: 一度想找匹兹堡的类似数据 //@美国中部大平原的胖胖:有意思。 [ [微博](http://www.weibo.com/5220650532/BsJmK51DT) ]
+
+> 2014-10-21 @好东西传送门: 刚才帮人找数据挖到一个好玩的, 搞LBS, GPS, 数据挖掘的快来围观。 http://t.cn/R7tGZFJ Github,CSV表格,明尼苏达警察局的800k车牌记录。已做过隐私保护处理, 每条记录包括: License Plate ID Latitude Longitude Time collected Reader [ [微博](http://www.weibo.com/5220650532/BsztgACau) ]
+
+2014-10-22 非常炫。原文的程序是用docx发布的,不方便,现在发布在gist上 http://t.cn/R7V794U [ [微博](http://www.weibo.com/5220650532/BsJkLooNj) ]
+
+> 2014-10-14 @Arduinos: 【arduino与人脑连接】荷兰arduinos爱好者Kayleigh Beard演示人脑控制led灯。她示范了自己制作的人脑交互作品,视频http://t.cn/R7ZgW4o,用意念控制一排led按顺序亮灭。教程http://t.cn/R7ZgW4X,源代码http://t.cn/R7ZgW4S。用到了arduino uno, MindWave Mobile脑电仪。 [ [微博](http://www.weibo.com/2524468112/BrvyLpk0E) ]
+
+2014-10-22 问答297 除了直接爬网站,也可以下载数据集 以前推荐过 common crawl 数据集,http://t.cn/R7cs7Nv 还有一个GoogleNews 数据集 1.2G http://t.cn/R7cs7Cs 更多相关数据集参见 http://t.cn/R7cs7Nm [ [微博](http://www.weibo.com/5220650532/BsJ3dF40k) ]
+
+> 2014-10-22 @Serena_pancakes: 在国外想用python抓news website用来分析词频的,可是crawling会被封IP,还没有api的话怎么办?@网路冷眼 @好东西传送门 @Python开发者 [ [微博](http://www.weibo.com/1077087607/BsIiU5Wsa) ]
+
+2014-10-22 一般就是降低频率,还有上Amazon EC2用spot instance,不断换IP。如果只是分析词频,不需要最新的内容,建议提取一部分Common Crawl语料库,别人已经都帮你抓好了,那里应有尽有。http://t.cn/R77RbnD [ [微博](http://www.weibo.com/5220650532/BsJ2gAUER) ]
+
+> 2014-10-22 @Serena_pancakes: 在国外想用python抓news website用来分析词频的,可是crawling会被封IP,还没有api的话怎么办?@网路冷眼 @好东西传送门 @Python开发者 [ [微博](http://www.weibo.com/1077087607/BsIiU5Wsa) ]
+
+2014-10-22 感谢 @NLPJob @龙星镖局 @AixinSG @伯乐在线官方微博 。今天的邮件试着发了一期长版(上次投票的结果70%的读者希望收到长版),因为内容长了,在摘要,版式上可能还需要新的改进,欢迎大家继续提意见。5条短版还继续以长微博发送。 [ [微博](http://www.weibo.com/5220650532/BsHaefg8j) ]
+
+> 2014-10-22 @好东西传送门: 机器学习头条2014-10-21 http://t.cn/R7cKd4c 1)哥伦比亚大学Michael Collins的NLP 14年秋季课程 2)王益《分布式机器学习的故事》 3)Michael Jordan: Why Big Data Could Be a Big Fail 4)深度学习、自然语言处理和表征方法 5)计算机科学会议的顶级会议最佳论文列表 加长版42条 http://t.cn/R7cKd42 [ [微博](http://www.weibo.com/5220650532/BsH8C5KS1) ]
+
+2014-10-22 机器学习头条2014-10-21 http://t.cn/R7cKd4c 1)哥伦比亚大学Michael Collins的NLP 14年秋季课程 2)王益《分布式机器学习的故事》 3)Michael Jordan: Why Big Data Could Be a Big Fail 4)深度学习、自然语言处理和表征方法 5)计算机科学会议的顶级会议最佳论文列表 加长版42条 http://t.cn/R7cKd42 [ [微博](http://www.weibo.com/5220650532/BsH8C5KS1) ]
+
+2014-10-22 我正在使用"花栗鼠"#封面图#,好漂亮,你们都快来试试! http://t.cn/zRVa3ar [ [微博](http://www.weibo.com/5220650532/BsH8p5zct) ]
+
+2014-10-22 《Deep Learning(深度学习)资料整理》 作者zouxy09@qq.com 36页的好的入门介绍 感谢@一尘不染zzz 整理成pdf [ [微博](http://www.weibo.com/5220650532/BsFG41AmM) ]
+
+> 2014-10-05 @一尘不染zzz: #深度学习#知识资料。最初是一个网友整理发布在他的BLOG上的。我不过是整理成PDF版 http://t.cn/Rhr3w3h 。#机器学习#几乎已经引发了一场信息处理的革命(搜索引擎、语音识别,图像识别,内容过滤、分类等的)相信机器学习接下来几年会在机器人领域引发另外一场让人惊奇革命。 [ [微博](http://www.weibo.com/1668848731/Bq4zGbuk1) ]
+
+2014-10-22 转发微博 [ [微博](http://www.weibo.com/5220650532/BsDW6yBOX) ]
+
+> 2014-10-21 @2gua: 几个不错的前端技术资源:「20 More Docs and Guides for Front-End Developers」http://t.cn/R7t8rDv,「Why I Love AngularJS and You Should Too」http://t.cn/R7t8rDh,「7 JS Libraries for Specific Visualizations」http://t.cn/R7t8rDP。@网路冷眼 @好东西传送门 @极客头条 @Linux中国 [ [微博](http://www.weibo.com/1609119537/BsBRaAQ53) ]
+
+2014-10-21 LIVAC汉语共时语料库(Linguistic Variation in Chinese Speech Communities) http://t.cn/R7chgF2 “直至2013年,LIVAC已处理逾5亿字,累积并持续提炼出约两百万词条。” 19年积累,7个特征语料收集地:香港,台湾,北京,上海, 澳门,新加坡,广州 。可惜是公司维护未开源,我辈只能望知识兴叹了 [ [微博](http://www.weibo.com/5220650532/BsDhZEsLS) ]
+
+2014-10-21 Pycoder's Weekly 搜罗Py万物的蟒周刊 英文版http://t.cn/zOzpHxB 中文版 http://t.cn/8FIrxNN [ [微博](http://www.weibo.com/5220650532/BsAMAjiT3) ]
+
+> 2014-10-21 @ZoomQuiet: Issue 137: RPython #蠎周刊# 汇集全球蠎事儿 !-) http://t.cn/R7tLoB7 [ [微博](http://www.weibo.com/1400936805/Bsz74bWSx) ]
+
+2014-10-21 根据过去两个月的数据,我们这个技术圈子(大体就是机器学习,自然语言处理,信息检索,计算机视觉,语义网等)最受欢迎(根据发言在圈子里的分享次数)的个人有@AixinSG @KissDev @丕子 @刘鑫Mars @梁斌penny @王威廉 @网路冷眼 @西瓜大丸子汤 @陈利人 @龙星镖局 (排名不分先后) [ [微博](http://www.weibo.com/5220650532/BsAF3615o) ]
+
+2014-10-21 非常有用的全美按街区人口数,种族构成地图,纽约时报出品。数据来源是2010人口普查http://t.cn/hboaoT [ [微博](http://www.weibo.com/5220650532/BsAlqhKxe) ]
+
+> 2014-07-26 @JadeM104: 分享一个我觉得很有用的地图,distribution of racial and ethnic groups: http://t.cn/hboaoT 出门在外小心,一切尽在不言中了 [ [微博](http://www.weibo.com/1682042892/BfjyFDvNe) ]
+
+2014-10-21 右边是中国最好的机器视觉公司之一。你们也对车牌感兴趣么?嗯,每个城市都有上万个交通摄像头,识别车牌可是个大买卖 //@格灵深瞳: 马!随手,不谢。 [ [微博](http://www.weibo.com/5220650532/BszSMkZbO) ]
+
+> 2014-10-21 @好东西传送门: 刚才帮人找数据挖到一个好玩的, 搞LBS, GPS, 数据挖掘的快来围观。 http://t.cn/R7tGZFJ Github,CSV表格,明尼苏达警察局的800k车牌记录。已做过隐私保护处理, 每条记录包括: License Plate ID Latitude Longitude Time collected Reader [ [微博](http://www.weibo.com/5220650532/BsztgACau) ]
+
+2014-10-21 CUHK-SEEM=香港中文大学系统工程与工程管理学系 http://t.cn/zlzfIjQ 系里的教授列表http://t.cn/R7t5DMa 与博文提到的领域接近的有林伟教授的 Text Mining Group http://t.cn/zQvzXhZ [ [微博](http://www.weibo.com/5220650532/BszHcDnr2) ]
+
+> 2014-10-21 @李菁求能毕业: 有木有人感兴趣来CUHK-SEEM做研究助理、工程师或者博士后,需要有计算机或者数学背景,有NLP、Data Mining、Machine learning、Social Computing相关经验优先~薪水非常可观~感兴趣的话可以发送邮件到wise.cuhk@gmail.com 我们会安排一个小的interview,具体事宜可以到时相商~求扩散求转发~~~ [ [微博](http://www.weibo.com/2249908040/Bszo1f8Qv) ]
+
+2014-10-21 刚才帮人找数据挖到一个好玩的, 搞LBS, GPS, 数据挖掘的快来围观。 http://t.cn/R7tGZFJ Github,CSV表格,明尼苏达警察局的800k车牌记录。已做过隐私保护处理, 每条记录包括: License Plate ID Latitude Longitude Time collected Reader [ [微博](http://www.weibo.com/5220650532/BsztgACau) ]
+
+2014-10-21 找到一个相关问答 http://t.cn/R7t4LTm [ [微博](http://www.weibo.com/5220650532/BszjRAXR8) ]
+
+> 2014-10-18 @丕子: 帮求一个车牌数据集 [ [微博](http://www.weibo.com/1665335994/Bs5HRcYyz) ]
+
+2014-10-21 帮转,有没有人知道线索呢? 进展整理在issue 293 http://t.cn/R7tU2dw [ [微博](http://www.weibo.com/5220650532/BszeWmrdL) ]
+
+> 2014-10-18 @丕子: 帮求一个车牌数据集 [ [微博](http://www.weibo.com/1665335994/Bs5HRcYyz) ]
+
+2014-10-21 有朋友感觉比较长,没法很快看完;另一方面,有没有漏掉的好东西呢? [ [微博](http://www.weibo.com/5220650532/BsyN3oPWs) ]
+
+> 2014-10-21 @好东西传送门: 刚刚发出了Python日报的第一期测试(也见长微博)。在线版:http://t.cn/R75uDpD 订阅办法见py.memect.com http://t.cn/R7UjD75 也可以给 hao@memect.com 发封邮件,标题是 "订阅Python"。Python日报没有长短版之分,每天大约会有10-20条。欢迎大家提建议 [ [微博](http://www.weibo.com/5220650532/BsxAAkvEv) ]
+
+2014-10-21 刚刚发出了Python日报的第一期测试(也见长微博)。在线版:http://t.cn/R75uDpD 订阅办法见py.memect.com http://t.cn/R7UjD75 也可以给 hao@memect.com 发封邮件,标题是 "订阅Python"。Python日报没有长短版之分,每天大约会有10-20条。欢迎大家提建议 [ [微博](http://www.weibo.com/5220650532/BsxAAkvEv) ]
+
+2014-10-21 还有,万维网联盟 (World Wide Web Consortium,W3C), 于 1994年10月在麻省理工学院(MIT)。它联合工业界制定了一大堆开放性的全球规范(Web码农的简历上的常见关键词), 例如 URI, HTML,CSS,XML,DOM, XQuery, WSDL, SVG, PNG, RDF, SPARQL ... [ [微博](http://www.weibo.com/5220650532/Bsxr4wksm) ]
+
+> 2014-10-21 @好东西传送门: W3C 20周年纪念大会 “万维网的未来” (The Future of the Web) http://t.cn/R75Euba 将于本月29日(当地时间下午3点至6点)在硅谷举行, 门票$150 (机票自负;-), 有在线直播。压轴戏是万维网之父Tim Berners-Lee于5:40–6:00的总结陈词, 也期待MIT media lab的 Alex 'Sandy' Pentland 教授的报告 [ [微博](http://www.weibo.com/5220650532/BsxeWdCjm) ]
+
+2014-10-21 W3C 20周年纪念大会 “万维网的未来” (The Future of the Web) http://t.cn/R75Euba 将于本月29日(当地时间下午3点至6点)在硅谷举行, 门票$150 (机票自负;-), 有在线直播。压轴戏是万维网之父Tim Berners-Lee于5:40–6:00的总结陈词, 也期待MIT media lab的 Alex 'Sandy' Pentland 教授的报告 [ [微博](http://www.weibo.com/5220650532/BsxeWdCjm) ]
+
+2014-10-21 最全的计算机科学会议的顶级会议最佳论文(Best Paper Award)列表,详列1996年以来获奖论文和下载链接!包括人工智能(AAAI CIKM KDD ICML IJCAI) 自然语言处理(ACL) 人机交互(CHI) 软件工程(FSE ICSE) 数据库(SIGMOD VLDB) 网络(WWW)等领域29个会议http://t.cn/R75EOUC 整理者是布朗大学的Jeff Huang [ [微博](http://www.weibo.com/5220650532/BsxdjsNYU) ]
+
+2014-10-21 感谢 @王威廉 @研究者July @干二微博 @网路冷眼 长版里继续有更多全国计算语言学会议(CCL)的讨论,值得围观 http://t.cn/R758sQj [ [微博](http://www.weibo.com/5220650532/Bsx0DrChj) ]
+
+> 2014-10-21 @好东西传送门: 机器学习头条 2014-10-20 http://t.cn/R758sQl 1)微电影Behind the Mic科普语音识别的历史 2)邹博之凸优化PPT 3)IBM开放Watson的API 4)CVPR2014视频分割的教程 5)Bloom filters(布隆过滤器)简介 加长版50条 http://t.cn/R758sQj [ [微博](http://www.weibo.com/5220650532/BswZ6hHwr) ]
+
+2014-10-21 机器学习头条 2014-10-20 http://t.cn/R758sQl 1)微电影Behind the Mic科普语音识别的历史 2)邹博之凸优化PPT 3)IBM开放Watson的API 4)CVPR2014视频分割的教程 5)Bloom filters(布隆过滤器)简介 加长版50条 http://t.cn/R758sQj [ [微博](http://www.weibo.com/5220650532/BswZ6hHwr) ]
+
+2014-10-21 #计算机视觉# 图一、 Flickr视觉团队官网上有一个很酷的在线演示 http://t.cn/R75H5KT 1秒钟能判断选定的图中 “有鸟吗?”、“在公园吗?” 图二、技术路线用深度学习在Hadoop和Storm平台上识别图片中的事物 http://t.cn/R75lK3J 图三、一张漫画展示研究动机; 相关论文 http://t.cn/R75H5KY [ [微博](http://www.weibo.com/5220650532/BswuGt55g) ]
+
+2014-10-21 Jupyter是一个从IPython衍生出来的交互式计算平台,改名的原因是IPython已经不仅支持Python计算,也支持Julia, R, Ruby等。项目主页和Scipy14上的演讲 http://t.cn/R7hRare PPT http://t.cn/R75YxA3 Github http://t.cn/R75YxAu [ [微博](http://www.weibo.com/5220650532/Bsw6LoUwz) ]
+
+2014-10-21 微软印度研究院的R2 Probabilistic Programming Tool项目 http://t.cn/R75WD0C 最近核心文章 R2: An Efficient MCMC Sampler for Probabilistic Programs 发表于AAAI'14 http://t.cn/R75jJId 平台代码库(C#)下载, 基于.NET Framework 4.5. 相关项目是剑桥组的 infer.net http://t.cn/SvEGTl [ [微博](http://www.weibo.com/5220650532/BsvUiFWLf) ]
+
+2014-10-20 与有荣焉 //@陆浑戎: 多谢推荐,都是爱发资源的盆友吧 [ [微博](http://www.weibo.com/5220650532/Bsseo0pII) ]
+
+> 2014-10-20 @传媒老跟班: 推荐几个账号:@陆浑戎 @设定控 @万事风过耳 @殆知阁 @好东西传送门 @次家神受 @电影贩 @蓝影屋 @一只傲骄 @电影的力量 至于原因,大家点开这些账号就知道了。 [ [微博](http://www.weibo.com/5198011111/BsrUmlJBD) ]
+
+2014-10-20 有人反映有墙.不知这两个能不能访问 pdf http://t.cn/R7qQcbc 代码 http://t.cn/R7qQcbf //@好东西传送门: Gaussian Mixture Models Tutorial and MATLAB Code [ [微博](http://www.weibo.com/5220650532/Bsq6ceu3K) ]
+
+> 2014-10-20 @赶路人林文: @好东西传送门 一篇关于GMM的文章,讲的很清晰,内有Matlab代码示范以及相关例子的代码。http://t.cn/R7q9dDT [ [微博](http://www.weibo.com/2351012892/BspbXoFZZ) ]
+
+2014-10-20 Gaussian Mixture Models Tutorial and MATLAB Code [ [微博](http://www.weibo.com/5220650532/BspJzex7T) ]
+
+> 2014-10-20 @赶路人林文: @好东西传送门 一篇关于GMM的文章,讲的很清晰,内有Matlab代码示范以及相关例子的代码。http://t.cn/R7q9dDT [ [微博](http://www.weibo.com/2351012892/BspbXoFZZ) ]
+
+2014-10-20 感谢 @网路冷眼 @慕知网 @西瓜大丸子汤 @龙星镖局 @CCL-2014 今天还有非常多的好内容在长版的"温故知新"中,主要是昨天CCL2014分享出来的各种干货和精彩的讨论:周志华教授和李明院士的两个特邀报告,知识图谱研讨会的PPT http://t.cn/R7qMPcd [ [微博](http://www.weibo.com/5220650532/BsojtjheH) ]
+
+> 2014-10-20 @好东西传送门: 机器学习头条 2014-10-19 http://t.cn/R7qMPcr 1)Datumbox开源它们自己的机器学习框架 2)@神经元NL 的Learning From Data学习笔记 3)Boosting和香农信道编码定理 4)Bengio组(蒙特利尔大学LISA组)深度学习教程 5)知识图谱:大数据语义链接的基石-李涓子 加长版39条 http://t.cn/R7qMPcd [ [微博](http://www.weibo.com/5220650532/BsoifEU3e) ]
+
+2014-10-20 机器学习头条 2014-10-19 http://t.cn/R7qMPcr 1)Datumbox开源它们自己的机器学习框架 2)@神经元NL 的Learning From Data学习笔记 3)Boosting和香农信道编码定理 4)Bengio组(蒙特利尔大学LISA组)深度学习教程 5)知识图谱:大数据语义链接的基石-李涓子 加长版39条 http://t.cn/R7qMPcd [ [微博](http://www.weibo.com/5220650532/BsoifEU3e) ]
+
+2014-10-20 非常感谢!对大家有用让我们很开心 [ [微博](http://www.weibo.com/5220650532/BsnbJoEON) ]
+
+> 2014-10-20 @VikingMew: 給@好东西传送门 捐了20塊錢。在意識到可以節省我多少刷微博的時間之後。 [ [微博](http://www.weibo.com/1963340133/Bsn36xsfw) ]
+
+2014-10-20 @廖雪峰 的Python教程,"这是小白的Python新手教程",以前推荐过,再推荐一次 [ [微博](http://www.weibo.com/5220650532/Bsmw5mlid) ]
+
+> 2014-10-19 @KissDev: 机器学习的书籍为何大都爱使用Python语言 ? 首先是因为python简单易用,更主要的原因是第三方模块/库太丰富了,信手拈来,这一点目前 php/go/nodejs还比不上 推荐这个教程,大概一个小时就能学会py: http://t.cn/zQXcs9S [ [微博](http://www.weibo.com/1699016425/BskpXhgUT) ]
+
+2014-10-20 Michael S. Brown是新加坡国立大学的教授 http://t.cn/heVofJ 他专门研究消费者电子产品中的计算机视觉问题,如相机, Xbox,投影仪等.去年的ICIP上他还做了个类似的教程From RAW to sRGB and Back: Modeling the Onboard Camera Processing Pipeline http://t.cn/R7qLUXL [ [微博](http://www.weibo.com/5220650532/BslMx6WKX) ]
+
+> 2014-10-19 @cvnote计算机视觉笔记: 拍照时相机对图像进行了那些处理?| ECCV'14 Tutorial《Understanding the In-Camera Image Processing Pipeline for Computer Vision》,详细介绍了相机算法中颜色变换算法的细节,可以作为了解颜色空间理论和应用的参考,搜搜资料啥的。http://t.cn/Rhc4ydF [ [微博](http://www.weibo.com/3812841100/BsjsMpNC5) ]
+
+2014-10-19 还有, http://t.cn/R7qPSnI Twitter Does Not Actually Predict Box Office Sales [STUDY] 提到一篇论文, 研究了Twitter和IMDB等影评网站的预测有效性 http://t.cn/zjYAeDY Why Watching Movie Tweets Won't Tell the Whole Story? //@phunter [ [微博](http://www.weibo.com/5220650532/BskG1mNF9) ]
+
+> 2014-10-19 @冷姿君: #冷知#发现一个网站,叫做The Internet Movie Script Database(IMSDB),上面有大量好莱坞经典电影的剧本,感兴趣的同学不要错过哦。[阴险] [ [微博](http://www.weibo.com/3888073849/BsgFBrDcR) ]
+
+2014-10-19 不传paper了,传个有趣的字体 [ [微博](http://www.weibo.com/5220650532/BsiJc4VLe) ]
+
+> 2014-10-19 @alim0x: 添加ubuntu对emoji表情的显示支持 sudo apt-get install ttf-ancient-fonts [ [微博](http://www.weibo.com/5139583946/BsiEP4Jvh) ]
+
+2014-10-19 IMSDB 链接直达http://t.cn/Gy8xd 搭售我们以前推过的电影评价数据MovieTweetings http://t.cn/R7GX32X 和电影海报数据库MoviePosterDB http://t.cn/R7GX326 //@phunter_lau: NLP素材,比如从剧本预测卖座与否 [ [微博](http://www.weibo.com/5220650532/BshsSg45e) ]
+
+> 2014-10-19 @冷姿君: #冷知#发现一个网站,叫做The Internet Movie Script Database(IMSDB),上面有大量好莱坞经典电影的剧本,感兴趣的同学不要错过哦。[阴险] [ [微博](http://www.weibo.com/3888073849/BsgFBrDcR) ]
+
+2014-10-19 //@velvel2: 1)Margin本身旨在降低分类器的方差(对比感知机)。2)而Gao-Zhou的工作指出Margin自身的方差也要关注,可谓是方差之方差。3)除了margin理论和统计视角,没有别的解释了?//@孙茂松: 现场报告时很多精彩之处,PPT还没有完全反映出来。那是到现场听报告者的额外bonus。 [ [微博](http://www.weibo.com/5220650532/Bsgnpil9R) ]
+
+> 2014-10-18 @孙茂松: 南京大学周志华教授在CCL上做大会特邀报告“Boosting 25 Years”。这是我近年来听到的最精彩的学术报告之一。400多位与会代表普遍反映报告内容深入浅出,令人耳目一新,收获很大。 @南大周志华 [ [微博](http://www.weibo.com/1970879995/BsbfNlrTe) ]
+
+2014-10-19 清华大学李涓子教授所在的知识工程研究室,是国内重要的语义网和知识工程研究小组之一.他们很早就开始了知识图谱相关研究.这个报告里李涓子从语义网延革的角度剖析了知识图谱的来龙去脉 @唐杰THU [ [微博](http://www.weibo.com/5220650532/Bsf9x2FIM) ]
+
+> 2014-10-17 @CCL-2014: 大量干货来袭(知识图谱研讨会 PPT), 知识图谱:大数据语义链接的基石-李涓子 http://t.cn/R7U4t3V [ [微博](http://www.weibo.com/5334438898/BrXVwukjE) ]
+
+2014-10-19 @讯飞胡国平 (@科大讯飞 ) 分享了在音乐领域和客服领域的知识图谱应用 [ [微博](http://www.weibo.com/5220650532/Bsf7Ibsmm) ]
+
+> 2014-10-17 @CCL-2014: 知识图谱研讨会 PPT:从应用的角度看知识图谱的价值和挑战-胡国平 http://t.cn/R7U4XAM [ [微博](http://www.weibo.com/5334438898/BrXW83Fax) ]
+
+2014-10-19 @沈李斌NLP 在 @出门问问 从事自然语言处理.他以前在BBN,Akamai, IBM等公司从事研究工作,在机器翻译与句法分析等领域有很多贡献 [ [微博](http://www.weibo.com/5220650532/Bsf6yEAjv) ]
+
+> 2014-10-17 @CCL-2014: 知识图谱研讨会 PPT: 问答系统中的知识图谱-沈李斌 http://t.cn/R7U49Vt [ [微博](http://www.weibo.com/5334438898/BrXWudI63) ]
+
+2014-10-19 刚刚推荐到头条 http://t.cn/R7bDGPA [ [微博](http://www.weibo.com/5220650532/Bsf1YCOLC) ]
+
+> 2014-10-18 @CCL-2014: 周志华教授特邀报告PPT: BOOSTING 25年 http://t.cn/R7bMKaA [ [微博](http://www.weibo.com/5334438898/Bsa7pdONv) ]
+
+2014-10-19 感谢@南大周志华 @孙茂松 @丕子 @bitslife @cswhjiang . 这几天重要活动是第十三届全国计算语言学会议CCL2014在华中师范大学召开,加长版里有更多汇报http://t.cn/R7bDGPA .欢迎参与会议的同仁多在微博上分享,我们会及时总结在日报里 [ [微博](http://www.weibo.com/5220650532/BseYMo69t) ]
+
+> 2014-10-19 @好东西传送门: 机器学习头条2014-10-18 http://t.cn/R7bDPUz 1)周志华在CCL大会做特邀报告Boosting 25 Years 2)EMNLP上两篇关于股票趋势的应用论文 3)DeepLearning University更新了162篇新文章 4)UCLA 统计软件学习资源网站 5)Vowpal Wabbit,Liblinear/SBM和StreamSVM性能比较 加长版44条 http://t.cn/R7bDPU7 [ [微博](http://www.weibo.com/5220650532/BseXnu3oZ) ]
+
+2014-10-19 机器学习头条2014-10-18 http://t.cn/R7bDPUz 1)周志华在CCL大会做特邀报告Boosting 25 Years 2)EMNLP上两篇关于股票趋势的应用论文 3)DeepLearning University更新了162篇新文章 4)UCLA 统计软件学习资源网站 5)Vowpal Wabbit,Liblinear/SBM和StreamSVM性能比较 加长版44条 http://t.cn/R7bDPU7 [ [微博](http://www.weibo.com/5220650532/BseXnu3oZ) ]
+
+2014-10-19 Python数据分析基础教程:Numpy学习指南 http://t.cn/zRCEjvM 英文原版NumPy Beginner's Guide http://t.cn/R7brKdm [ [微博](http://www.weibo.com/5220650532/BseylzC1l) ]
+
+> 2014-10-19 @2gua: 平板上看电子书就是舒适满满…… [ [微博](http://www.weibo.com/1609119537/Bseq5xtf2) ]
+
+2014-10-19 //@尘绳聋-SYSU:这个其实是Theano搞DL的tutorial,教如何用Theano实现常用的几个模型。其实Release 1.0去年9月已经出来了,瞄了一眼这个,是Oct. 18 2014的,不过基本内容好像没改动。有空再仔细看看。 [ [微博](http://www.weibo.com/5220650532/BsbGDzRkr) ]
+
+> 2014-10-19 @龙星镖局: 这可能是今年关于深度学习最好的材料了,深度学习一线大牛Bengio组写的教程,算法深入显出,还有实现代码,一步步展开。读完之后也可以说是搞过深度学习了呢。[good]@好东西传送门 @蒋涛CSDN @developerWorks 『』http://t.cn/zT2M85O [ [微博](http://www.weibo.com/1830516311/BsbxblR33) ]
+
+2014-10-18 还有,补充一个3年多前在hackernews上对该文的讨论 http://t.cn/R7b0g98 不少人也讨论了其他语言(matlab, ruby, perl, java, R .... ) 的特点以及不转到python的原因 [ [微博](http://www.weibo.com/5220650532/Bsbn5vegJ) ]
+
+> 2014-10-18 @好东西传送门: Why Python Rocks for Research http://t.cn/R74Duja 这篇文章里Hoyt Koepke总结了Python作为研究语言的十大优势:通用性(相对Matlab/R),可读性,高层抽象与底层操作的平衡,作为胶水语言的互操作性,文档,层次模块系统,灵活的数据结构,丰富的包,测试框架. [ [微博](http://www.weibo.com/5220650532/Bs7Xo03FG) ]
+
+2014-10-18 Why Python Rocks for Research http://t.cn/R74Duja 这篇文章里Hoyt Koepke总结了Python作为研究语言的十大优势:通用性(相对Matlab/R),可读性,高层抽象与底层操作的平衡,作为胶水语言的互操作性,文档,层次模块系统,灵活的数据结构,丰富的包,测试框架. [ [微博](http://www.weibo.com/5220650532/Bs7Xo03FG) ]
+
+2014-10-18 http://t.cn/Rh9Tsnt Science杂志和中国航天员中心人因工程重点实验室推出67页的专刊Human Performance in Space,发表了31篇中国载人航天的研究成果,如太空生理,太空中的认知行为和人机交互HCI,人体建模与绩效评估等.特别是其中HCI和认知部分对计算机科学研究也很有启发.这条新闻你想at谁? [ [微博](http://www.weibo.com/5220650532/Bs6G9rx1a) ]
+
+2014-10-18 Li Ming是经典著作An Introduction to Kolmogorov Complexity and Its Applications的作者.他最近对Information Distance的研究对自然语言处理,问答系统都提供了新颖视角 http://t.cn/R740ao2 [ [微博](http://www.weibo.com/5220650532/Bs6hjmVNW) ]
+
+> 2014-10-13 @孙茂松: CCL特邀报告:加拿大皇家学会院士李明“Approximating Semantics”,微软亚洲研究院首席研究员Junichi Tsujii“Linking Text with Data & Knowledge Bases”,长江学者周晓林“Processing Construction-based Pragmatic Constraints during Sentence Comprehension”和长江学者周志华“Boosting 25年” [ [微博](http://www.weibo.com/1970879995/BroeAdCkw) ]
+
+2014-10-18 非常棒!//@bitslife: 刚刚更新了162篇新文章 http://t.cn/R74K9sg [ [微博](http://www.weibo.com/5220650532/Bs5Zuv45d) ]
+
+> 2014-10-18 @bitslife: 看到下面一个页面,深感深度学习(Deep Learning)的应用太广了,从硬件、图像到健康、生物、大数据、生物信息再到量子计算等,Amund Tveit等维护了一个DeepLearning.University小项目:收集从2014年开始深度学习文献,相信可以作为深度学习的起点。http://t.cn/RhoE0gh Github:http://t.cn/R74KS5j [ [微博](http://www.weibo.com/1895047203/Bs5QTqlLI) ]
+
+2014-10-18 国内也有很好的论坛, 例如人大经济论坛 http://t.cn/hrPJFc 新界面大约是2013五六月推出的 http://t.cn/R74SKcd //@司马左右: 真是越做越漂亮,后悔没有把之前的样子截图。国内为什么没有类似的网站呢?反而是一些统计软件使用基础的商业培训和一些要什么金币的资源网站大行其道。//@沈浩老师:保留 [ [微博](http://www.weibo.com/5220650532/Bs5FsfSiy) ]
+
+> 2014-10-18 @好东西传送门: 推荐一个统计软件学习资源网站(UCLA统计咨询小组维护) http://t.cn/R74xS4x 覆盖众多统计软件: R, SAS, SPSS, STATA 资料合集 http://t.cn/R74xS4J 两个速查表 1. 常见数据分析方法分别推荐代码例子 http://t.cn/R74xS46 2. 按变量的数量,性质及测试方法分别推荐代码例子 http://t.cn/R74xS4X [ [微博](http://www.weibo.com/5220650532/Bs4XR5nkJ) ]
+
+2014-10-18 回复@phunter_lau: 我们就是松鼠银行。小松鼠们不看没关系,在我们这里永远保存的。 //@phunter_lau:似乎是松鼠症总结,肯定很多只转不看留着过冬结果来年就忘记了 [ [微博](http://www.weibo.com/5220650532/Bs5gOwHXH) ]
+
+> 2014-10-18 @好东西传送门: 好东西周报刚刚发出 http://t.cn/R74iqHY 如果过去一周有错过的好东西,看这个周报就好了 [呵呵] [ [微博](http://www.weibo.com/5220650532/Bs5cHeQqW) ]
+
+2014-10-18 //@一刹春: 这篇报告可以放在更大的背景下来看——结构主义者与实验主义者之争,例如 http://t.cn/zQtdejz Pearl曾经很不客气地说:因果推断的计量模型受到了两股势力的绑架,一个是回归主义者,另一个是准实验主义者,例如Angrist and Pischke。顺便说,Pearl获得了2011年的图灵奖。 [ [微博](http://www.weibo.com/5220650532/Bs5eUmois) ]
+
+> 2014-04-22 @一刹春: Judea Pearl写过一篇挺有意思的报告,比较了六本流行的本科计量教材,看它们对结构方程中因果性概念的阐述是否到位。根据他的吹毛求疵,比较接近理想标准的是Stock & Watson和Wooldridge这两本——似乎与市场的反响一致……WP出来有两年了,没想到发在一个奇怪的杂志上:http://t.cn/8sToYJA [ [微博](http://www.weibo.com/2238838664/B0UkOdFMr) ]
+
+2014-10-18 好东西周报刚刚发出 http://t.cn/R74iqHY 如果过去一周有错过的好东西,看这个周报就好了 [呵呵] [ [微博](http://www.weibo.com/5220650532/Bs5cHeQqW) ]
+
+2014-10-18 还有,这个网站维护了一个数据集列表 http://t.cn/R74J1vT 索引了一大堆用于统计分析数据集,覆盖社会科学,公众健康,人口普查,国际政治,地理信息等领域 大家一起来挖这个网站上的好东西吧! [ [微博](http://www.weibo.com/5220650532/Bs59obmD6) ]
+
+> 2014-10-18 @好东西传送门: 推荐一个统计软件学习资源网站(UCLA统计咨询小组维护) http://t.cn/R74xS4x 覆盖众多统计软件: R, SAS, SPSS, STATA 资料合集 http://t.cn/R74xS4J 两个速查表 1. 常见数据分析方法分别推荐代码例子 http://t.cn/R74xS46 2. 按变量的数量,性质及测试方法分别推荐代码例子 http://t.cn/R74xS4X [ [微博](http://www.weibo.com/5220650532/Bs4XR5nkJ) ]
+
+2014-10-18 推荐一个统计软件学习资源网站(UCLA统计咨询小组维护) http://t.cn/R74xS4x 覆盖众多统计软件: R, SAS, SPSS, STATA 资料合集 http://t.cn/R74xS4J 两个速查表 1. 常见数据分析方法分别推荐代码例子 http://t.cn/R74xS46 2. 按变量的数量,性质及测试方法分别推荐代码例子 http://t.cn/R74xS4X [ [微博](http://www.weibo.com/5220650532/Bs4XR5nkJ) ]
+
+2014-10-18 在加长版里,我们还看到几家相关领域的创业公司的新闻:@FacePlusPlus (人脸识别) @格灵深瞳 (视觉) Nara(推荐餐馆) Idibon(舆情追踪) 机器学习现在也是投资与创业热点 [ [微博](http://www.weibo.com/5220650532/Bs4FPvH0r) ]
+
+> 2014-10-18 @好东西传送门: 机器学习头条 2014-10-17 http://t.cn/R74I6IW 1)Douglas Engelbart的书Boosting Our Collective IQ 2)34种免费的数据挖掘软件 3)RecSys2014完整报告视频 4)Hadoop上的轻量级语言Guinea Pig 5)面试资料:Mitbbs数据科学版主晨钟暮鼓推荐的三本书 加长版52条 http://t.cn/R74I6Il [ [微博](http://www.weibo.com/5220650532/Bs4DIlwed) ]
+
+2014-10-18 今天的头条来自 @西瓜大丸子汤 @赵家平USC @AixinSG @王威廉 [ [微博](http://www.weibo.com/5220650532/Bs4FLnwdQ) ]
+
+> 2014-10-18 @好东西传送门: 机器学习头条 2014-10-17 http://t.cn/R74I6IW 1)Douglas Engelbart的书Boosting Our Collective IQ 2)34种免费的数据挖掘软件 3)RecSys2014完整报告视频 4)Hadoop上的轻量级语言Guinea Pig 5)面试资料:Mitbbs数据科学版主晨钟暮鼓推荐的三本书 加长版52条 http://t.cn/R74I6Il [ [微博](http://www.weibo.com/5220650532/Bs4DIlwed) ]
+
+2014-10-18 机器学习头条 2014-10-17 http://t.cn/R74I6IW 1)Douglas Engelbart的书Boosting Our Collective IQ 2)34种免费的数据挖掘软件 3)RecSys2014完整报告视频 4)Hadoop上的轻量级语言Guinea Pig 5)面试资料:Mitbbs数据科学版主晨钟暮鼓推荐的三本书 加长版52条 http://t.cn/R74I6Il [ [微博](http://www.weibo.com/5220650532/Bs4DIlwed) ]
+
+2014-10-18 http://t.cn/8sQnHYm “Better predictions. Faster.” R和Python都支持,看起来很有趣 //@ofsky: datarobot有木有,Jeremy你又要高兴了 [ [微博](http://www.weibo.com/5220650532/Bs41xbM6q) ]
+
+> 2014-10-18 @医学统计分析精粹: 除了Scipy和Numpy,Python通往数据科学还有一个极为强大的接口,Pandas。本网页整理了Pandas入门的几个经典资源,隆重推介。http://t.cn/R74qqAO @西瓜大丸子汤 @医学统计分析精粹 [ [微博](http://www.weibo.com/1874048763/Bs3cupl8c) ]
+
+2014-10-18 问: @战术核显英伟达 关于stata有什么好的书籍? 答: 资源整理 http://t.cn/R74tSJA 推荐人大经济论坛 “stata专版” 。很喜欢 hopenothing 2011年写的书单和建议 http://t.cn/R74tSJw : "要应用它,前提是要懂计量理论", "先从中文基本书籍入门,简单操作上手之后直接看英文", "不要被方法统治了思想" [ [微博](http://www.weibo.com/5220650532/Bs3IIxJTH) ]
+
+2014-10-18 pandas最早是从金融数据处理开始的,现在已经演变成数据科学家必备了,不可不知 [ [微博](http://www.weibo.com/5220650532/Bs3gYdRjy) ]
+
+> 2014-10-18 @医学统计分析精粹: 除了Scipy和Numpy,Python通往数据科学还有一个极为强大的接口,Pandas。本网页整理了Pandas入门的几个经典资源,隆重推介。http://t.cn/R74qqAO @西瓜大丸子汤 @医学统计分析精粹 [ [微博](http://www.weibo.com/1874048763/Bs3cupl8c) ]
+
+2014-10-17 @ShangguanRPI @朝花夕拾录 @陈涛sean @黄亮-算法时代 @老齐Py @StephanieYR @左耳朵耗子 @郑昀 @张俊林say @算文解字 @易度-潘俊勇 特别问问你们,有没有更多的python牛人应该关注? [ [微博](http://www.weibo.com/5220650532/Bs0jmD16M) ]
+
+> 2014-10-17 @好东西传送门: 现在问题来了,微博上Python技术谁家最强?欢迎大家推荐Python牛人们 [ [微博](http://www.weibo.com/5220650532/Bs0b07bUZ) ]
+
+2014-10-17 现在问题来了,微博上Python技术谁家最强?欢迎大家推荐Python牛人们 [ [微博](http://www.weibo.com/5220650532/Bs0b07bUZ) ]
+
+2014-10-17 Python是人类的救星 //@phunter_lau: Pig的救星,Pig这玩意语法太反人类了 [ [微博](http://www.weibo.com/5220650532/BrZuejO1L) ]
+
+> 2014-10-17 @王威廉: Pig是管理Hadoop任务的一个高级程序语言,在Amazon的Elastic MapReduce平台上也有支持。上学期我们大数据机器学习课程介绍了Pig,不过Pig的语法有点诡异,学生普遍反映不好调试。针对此问题,William Cohen发明了一个叫Guinea Pig(荷兰猪)的轻量级语言,基于Python,非常有意思:http://t.cn/R7yRpKp [ [微博](http://www.weibo.com/1657470871/BrW1Ckjrd) ]
+
+2014-10-17 //@西瓜大丸子汤: Doug是一位思想家,更是一位实践者,他发明了鼠标,超文本,计算机联网,最早的图形用户界面,远程电视会议,远程实时合作等等...见The Mother of All Demos http://t.cn/zQ7gpBt 他可以说是Web之父之父,TBL的很多思想是从他那来的, BTW,也是图灵奖得主. [ [微博](http://www.weibo.com/5220650532/BrXuc9Wcq) ]
+
+> 2014-10-17 @西瓜大丸子汤: 向大家推荐Douglas Engelbart的书,最短的Boosting Our Collective IQ http://t.cn/R7UZhIU 只有三十多页,但我觉得比<失控>好十倍.另外两本<Bootstrapping><The Engelbart Hypothesis>不是他写的(他才没空写),不过都是对他的采访,也比较好.Doug对人类的影响极为深远,虽然大多数人不知道 [ [微博](http://www.weibo.com/1932835417/BrXs3b0Ry) ]
+
+2014-10-17 推荐一篇ACM Computing Surveys 2010年综述,讲关于时间的数理模型 http://t.cn/R7yFUYT 1. 时间模型的考量维度,例如 离散/连续,顺序/分支,并发/组合,... 2. 数理模型发展史, 3. 常见时间模型分类, 例如 Petri网, 时间逻辑(Temporal Logic), 进程代数(process calculi) ... 抛砖引玉,欢迎指正 [ [微博](http://www.weibo.com/5220650532/BrX0g9W3D) ]
+
+2014-10-17 推荐系统必读.会议论文集.http://t.cn/RhFPLGl [ [微博](http://www.weibo.com/5220650532/BrWrN9bOy) ]
+
+> 2014-10-17 @AixinSG: RecSys 2014 完整报告视频, 包括每篇文章的报告 YouTube 链接 http://t.cn/R7y34x0 [ [微博](http://www.weibo.com/1025887594/BrWpTfiE9) ]
+
+2014-10-17 这两个东东当然好, Leetcode 前些时候才推过 http://t.cn/R7ymOb8 "crack the coding interview" 这个PDF版行吗 http://t.cn/R7ymObQ //@睡眼惺忪的小叶先森: 让大神@whiteath @_靖难_ 也推荐一下。我估计推荐leetcode和砸死代码面试 [ [微博](http://www.weibo.com/5220650532/BrWi747Jh) ]
+
+> 2014-10-17 @好东西传送门: 美帝码农面试资料 Mitbbs数据科学版主 晨钟暮鼓 推荐三本书:《101 Great Answers to the Toughest Interview Questions》 http://t.cn/R7yHCSP "behavior问题",《Recommender Systems》(Xiavier) http://t.cn/RhCcR9f ,《The Algorithm Design Manual》 http://t.cn/R7yHCSh "算法:graph,hash,DP" [ [微博](http://www.weibo.com/5220650532/BrVHvllVW) ]
+
+2014-10-17 补充一下: 要斗败烙印,还得提高情商。“The Algorithm Design Manual” 有很多人推荐过 年初是@velvel2 。而现在各公司都搞精准广告投放, Xavier Amatriain讲义自然对口, 可以先看KDD2014版(135页), 再看MLSS2014版(248页) , 所有资料都汇总到问答274了 http://t.cn/R7yEf6b 。 [ [微博](http://www.weibo.com/5220650532/BrW6cAzFI) ]
+
+> 2014-10-17 @好东西传送门: 美帝码农面试资料 Mitbbs数据科学版主 晨钟暮鼓 推荐三本书:《101 Great Answers to the Toughest Interview Questions》 http://t.cn/R7yHCSP "behavior问题",《Recommender Systems》(Xiavier) http://t.cn/RhCcR9f ,《The Algorithm Design Manual》 http://t.cn/R7yHCSh "算法:graph,hash,DP" [ [微博](http://www.weibo.com/5220650532/BrVHvllVW) ]
+
+2014-10-17 问: 关于进程代数研究的paper? 答: 资料汇总 http://t.cn/R7LN18n 进程代数process calculi用于为并发系统形式化建模,包括: π-calculus, ambient calculus, PEPA, fusion calculus, join-calculus。有本书 "Process algebra: equational theories of communicating processes" [ [微博](http://www.weibo.com/5220650532/BrW0E3a1f) ]
+
+2014-10-17 "Introduction To Algorithms" vs "The Algorithm Design Manual" 两本算法神作的进一步讨论: 前者是算法课的常客,概念清晰偏重理论(也是门主买过的为数不多的几本原价纸书), 而后者是编程实战利器(代码随用随抄),尤其适合准备白板面试。码农不妨看看stackoverflow的讨论 http://t.cn/R7yQ5a5 [ [微博](http://www.weibo.com/5220650532/BrVN33les) ]
+
+> 2014-10-17 @好东西传送门: 美帝码农面试资料 Mitbbs数据科学版主 晨钟暮鼓 推荐三本书:《101 Great Answers to the Toughest Interview Questions》 http://t.cn/R7yHCSP "behavior问题",《Recommender Systems》(Xiavier) http://t.cn/RhCcR9f ,《The Algorithm Design Manual》 http://t.cn/R7yHCSh "算法:graph,hash,DP" [ [微博](http://www.weibo.com/5220650532/BrVHvllVW) ]
+
+2014-10-17 美帝码农面试资料 Mitbbs数据科学版主 晨钟暮鼓 推荐三本书:《101 Great Answers to the Toughest Interview Questions》 http://t.cn/R7yHCSP "behavior问题",《Recommender Systems》(Xiavier) http://t.cn/RhCcR9f ,《The Algorithm Design Manual》 http://t.cn/R7yHCSh "算法:graph,hash,DP" [ [微博](http://www.weibo.com/5220650532/BrVHvllVW) ]
+
+2014-10-17 感谢@Arber @邱锡鹏 @CSDN_CODE @Jay_GraphLab 为我们分享了这些好东西.Fudan NLP和Graphlab都能不断推陈出新,产品越来越容易使用,无论是单机还是云,现在应用NLP越来越容易了. [ [微博](http://www.weibo.com/5220650532/BrUq2jBGW) ]
+
+> 2014-10-17 @好东西传送门: 机器学习头条 2014-10-16 http://t.cn/R7y09uG 1)Gerhard Weikum在VLDB'14的关于大数据分析的教程 2)垃圾邮件分类数据集 3)吴立德讲概率主题模型和数据科学基础 4)复旦大学推出基于云的FudanNLP 5)GraphLab Create正式发布,单机处理海量数据 加长版50条 http://t.cn/R7y09ub [ [微博](http://www.weibo.com/5220650532/BrUoMi7u7) ]
+
+2014-10-17 机器学习头条 2014-10-16 http://t.cn/R7y09uG 1)Gerhard Weikum在VLDB'14的关于大数据分析的教程 2)垃圾邮件分类数据集 3)吴立德讲概率主题模型和数据科学基础 4)复旦大学推出基于云的FudanNLP 5)GraphLab Create正式发布,单机处理海量数据 加长版50条 http://t.cn/R7y09ub [ [微博](http://www.weibo.com/5220650532/BrUoMi7u7) ]
+
+2014-10-17 RGB+Depth 深度感知计算机视觉 structure.io上有很酷的demo http://t.cn/z8rCSiR [ [微博](http://www.weibo.com/5220650532/BrU4XFuFB) ]
+
+> 2014-10-16 @cvnote计算机视觉笔记: CVPR'14 OpenCV 3.0 RGBD Tutorial | 由当年Kickstarter火爆的RGBD传感器 初创公司Occipital Sensor提供,今天扫了一眼Github还有源代码,使用的RGBD算法已经加入了OpenCV的contrib模块。http://t.cn/R7yyrMM [ [微博](http://www.weibo.com/3812841100/BrRxPhuYd) ]
+
+2014-10-17 Weikum是数据库,信息检索语义网领域的一位重要研究者,他在Max-Planc研究所。主页http://t.cn/R7yX6Je [ [微博](http://www.weibo.com/5220650532/BrSLYm4uR) ]
+
+> 2014-10-16 @Arber: Gerhard Weikum在VLDB'14的关于Big Data Anlytics的tutorial,非常好的总结了大数据知识库和语义这块的主要问题和技术体系。强烈建议做数据的人看看。他在下个月CIKM'14还有一个talk,估计类似。 http://t.cn/RhftLDi p.s. 看完也就知道一找的整体技术路线了~ [ [微博](http://www.weibo.com/1818327890/BrSyKkZvA) ]
+
+2014-10-16 http://t.cn/RPqUcVL graphlab create主页直达 [ [微博](http://www.weibo.com/5220650532/BrS1lyrW2) ]
+
+> 2014-10-16 @Jay_GraphLab: 经过一年多努力,GraphLab Create正式发布1.0:单机轻松处理海量图表/图(graph)/文本/图像(image)数据;机器学习模块包括推荐系统/社交网络/文本分析/最近邻搜索,还有前沿的BoostedTrees/DeepLearning/FactorizationMachine/LDA等模型;模型可以简单地被推送到云端,作为网站/App后台的智能预测服务 [ [微博](http://www.weibo.com/1863703874/BrOrBsidt) ]
+
+2014-10-16 转发微博 [ [微博](http://www.weibo.com/5220650532/BrPPE2d2z) ]
+
+> 2014-10-16 @睡眼惺忪的小叶先森: 自己做的一个Introduction to Redis,给几个需要的同学看过,反响还行 [嘻嘻] http://t.cn/R7LmBxF @好东西传送门 @whiteath @囧囧有神的小杜霉女 [ [微博](http://www.weibo.com/2765244861/BrPOVDWpU) ]
+
+2014-10-16 Anaconda是一个Python科学计算库的集合.与之前介绍过的Sage之重分析和数学不同,Anaconda重数据和效率,提供了诸多大数据分析工具,如Blaze(分布式数据分析), Bokeh(可视化), Numba(更快的Python代码编译) 最新的版本打包了195个科学计算包,极大方便 http://t.cn/zHsZMWW [ [微博](http://www.weibo.com/5220650532/BrPuj5NZn) ]
+
+2014-10-16 问:@执手共看云归醉晚汐 垃圾邮件分类有什么数据集么? 答:资料汇总 http://t.cn/R7L0GJZ 垃圾邮件数据集常见的有 UCI, enron, SpamAssassin, TREC。注意 Spam Archive dataset 有1997-2014的1个多G压缩过的垃圾邮件。尚未找到专门对垃圾邮件进一步标注分类的公开数据集 敬请指正 [ [微博](http://www.weibo.com/5220650532/BrPrACNtA) ]
+
+2014-10-16 找了一些 http://t.cn/R7L0GJZ 你看是你需要的吗? [ [微博](http://www.weibo.com/5220650532/BrP11gwAx) ]
+
+> 2014-10-09 @执手共看云归醉晚汐: 垃圾邮件分类有什么数据集么@好东西传送门 @西瓜大丸子汤 [ [微博](http://www.weibo.com/1687018055/BqMNcAfmh) ]
+
+2014-10-16 相关 2014-08-02 @理想主义de患者 问:有没有垃圾邮件检测的项目啊。答:比较有效的方法都是结合机器学习与人工知识的。最有名的开源项目是SpamAssassin,可以从很多语言调用如Python 。另有个开源项目Stopspam也值得关注。 http://t.cn/R7L0iI7 [ [微博](http://www.weibo.com/5220650532/BrOXC1Qkq) ]
+
+> 2014-10-09 @执手共看云归醉晚汐: 垃圾邮件分类有什么数据集么@好东西传送门 @西瓜大丸子汤 [ [微博](http://www.weibo.com/1687018055/BqMNcAfmh) ]
+
+2014-10-16 感谢 @Copper_PKU @MOOC学院 @规勒个划 @BigData大数据 提供或帮我们发现了这些好资源 [ [微博](http://www.weibo.com/5220650532/BrLpIjj3x) ]
+
+> 2014-10-16 @好东西传送门: 机器学习头条 2014-10-15 http://t.cn/R72BEMB 1)125页的免费电子书,Boyd的ADMM综述 2)机器学习入门资源不完全汇总 3)好课推荐:斯坦福大学《博弈论》 4)BCL发布一亿Flickr照片数据集的中国部分 5)Andrew Ng公开演讲深度学习:用大规模大脑实现机器学习 加长版50条 http://t.cn/R72BEMd [ [微博](http://www.weibo.com/5220650532/BrLoXAaeH) ]
+
+2014-10-16 机器学习头条 2014-10-15 http://t.cn/R72BEMB 1)125页的免费电子书,Boyd的ADMM综述 2)机器学习入门资源不完全汇总 3)好课推荐:斯坦福大学《博弈论》 4)BCL发布一亿Flickr照片数据集的中国部分 5)Andrew Ng公开演讲深度学习:用大规模大脑实现机器学习 加长版50条 http://t.cn/R72BEMd [ [微博](http://www.weibo.com/5220650532/BrLoXAaeH) ]
+
+2014-10-16 恭喜中国卫生政策与管理学会(海外)成立.我们的朋友里也有好多卫生经济学和统计的同仁 @陈茁博士_Adam @医学统计分析精粹 @美国中部大平原的胖胖 //@史律: 轉發微博 [ [微博](http://www.weibo.com/5220650532/BrLkYBqOZ) ]
+
+> 2014-10-15 @romanxu: 在@行走江湖张大水 的不懈努力下,@CHPAMS 终于在共和国国庆那天正式注册成功。祝贺大水当选第一任主席。CHPAMS从2008在波士顿的第一次酝酿到如今已六年,我有幸见证了它发展的每一个瞬间。风风雨雨,茁壮成长。有大家一片赤情,CHPAMS会越办越好。作为其首任理事,我也愿为大家服好务。www.chpams.org [ [微博](http://www.weibo.com/1651598281/BrESQzYjA) ]
+
+2014-10-16 125页的免费电子书,Boyd的ADMM综述 pdf直达http://t.cn/R721y3V [ [微博](http://www.weibo.com/5220650532/BrL3Ty2Dv) ]
+
+> 2014-10-15 @Copper_PKU: Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers http://t.cn/R72zKr9 有paper有survey 有code 简直.... [ [微博](http://www.weibo.com/1758509357/BrGu0wSnP) ]
+
+2014-10-16 //@刘挺: LTP是@哈工大SCIR 历时十余年研制的一套中文处理基础工具平台,开源且提供云服务,很多开发者在用。这次我们在京召开一个LTP用户的交流会,请大家提意见和建议。LTP的研制者@车万翔 等师生会介绍LTP的原理、功能和使用方法,也会有老用户介绍使用经验,欢迎大家一起来交流! [ [微博](http://www.weibo.com/5220650532/BrJlv1Oep) ]
+
+> 2014-10-15 @哈工大SCIR: 第一届语言技术平台用户大会(LTP-2014)将于2014年10月31日上午在京举行,届时将邀请LTP的技术团队介绍技术原理和应用、LTP用户介绍使用经验,还将组织针对LTP的研讨。本次研讨会自由报名,竭诚欢迎学术界与企业界的朋友参加。会议安排及报名方式请访问会议主页:http://t.cn/R7AgbAZ @刘挺 @车万翔 [ [微博](http://www.weibo.com/1819811883/BrFOdEolM) ]
+
+2014-10-15 谢了,已经更新。书前段时间推荐过,正打算改天补充一个书单;林老师的机器学习基石课加上了; 最后一门课已包括 //@tang_Kaka_back: 再加上李航博士的《统计学习方法》。如果觉得数学功底还过得去,还可以试试就是台大林轩田老师的“Machine Learning Foundation” or Caltech的“Learning from Data” [ [微博](http://www.weibo.com/5220650532/BrGwvpfOY) ]
+
+> 2014-10-15 @好东西传送门: 问: 本科生想学机器学习, 求推荐一个学习路线图 答: 整理了《机器学习入门资源不完全汇总》 http://t.cn/R7AkewK 推荐先看基本概念与几个路线图,参考小伙伴的进修攻略 (包括此前推的 学霸的学习笔记), 选修一门网上公开课(Tom Mitchell, Andrew Ng)系统地打好基础,理解算法实战要点。欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BrG32lkwC) ]
+
+2014-10-15 问: 本科生想学机器学习, 求推荐一个学习路线图 答: 整理了《机器学习入门资源不完全汇总》 http://t.cn/R7AkewK 推荐先看基本概念与几个路线图,参考小伙伴的进修攻略 (包括此前推的 学霸的学习笔记), 选修一门网上公开课(Tom Mitchell, Andrew Ng)系统地打好基础,理解算法实战要点。欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BrG32lkwC) ]
+
+2014-10-15 Yaha"哑哈"中文分词(作者余争) 优点:可以自定义分词方法,有正则表达式插件,人名前缀插件,地名后缀插件,新词学习功能.还有关键字提取,文本摘要,词语纠错功能,不仅是分词.Python的,使用非常简单 Github http://t.cn/R7AQyPt 在线演示 http://t.cn/R7AQyPc [ [微博](http://www.weibo.com/5220650532/BrF5hsF21) ]
+
+2014-10-15 规划控,GIS控,图片控,赶快来围观,200万张照片哦 [ [微博](http://www.weibo.com/5220650532/BrF0Pe9WF) ]
+
+> 2014-10-15 @规勒个划: BCL发布Yahoo! 提供一亿Flickr照片数据集的中国部分(下载+裁剪),下载猛戳:http://t.cn/R7ATWph @北京城市实验室BCL [ [微博](http://www.weibo.com/1012425625/BrEYPEY3x) ]
+
+2014-10-15 UIUC黄嘉斌(Jia-Bin Huang)的奇妙工作:图像补全.从图像里抹掉或切掉一部分,可以根据背景补上相近的建筑,物体纹理等.http://t.cn/R7AWFqg Matlab代码已经开源 http://t.cn/R7AWFqd [ [微博](http://www.weibo.com/5220650532/BrEKjBTde) ]
+
+2014-10-15 黄嘉斌用特殊的“主成分分析法”PCA和奇异值分解法(singular value decomposition)SVD做韩国小姐脸部特征的分析,验证了那个著名的观点“大众脸很吸引人,但最吸引人的却不是大众脸”. 英文原文http://t.cn/zTYkQB0 [ [微博](http://www.weibo.com/5220650532/BrEFncjHG) ]
+
+> 2013-05-07 @果壳网: 【“韩国小姐”的脸到底有多相似?】2013年“韩国小姐”选美大赛开始后,曝光的20位佳丽面容惊人的相似。那么,这些姑娘的脸到底有多么像呢?能否用科学的方法量化这种相似性?伊利诺伊大学香槟分校搞计算机视觉的博士生黄嘉斌写了篇文章,用科学的方法揭开了这个谜团:http://t.cn/zTYBfsN [ [微博](http://www.weibo.com/1850988623/zvBrGl1TL) ]
+
+2014-10-15 转发微博 [ [微博](http://www.weibo.com/5220650532/BrEcZzvnv) ]
+
+> 2014-10-15 @BigData大数据: 【Andrew Ng加盟百度后第一公开演讲】吴恩达加盟百度后第一公开演讲,演讲题目:Deep Learning: Machine Learning via Large-scale Brain http://t.cn/R7ASfYu 有兴趣的可以看看 @杨静Lillian @龙星镖局 @云泉微博 @好东西传送门 @李元超Osiris @异步步 [ [微博](http://www.weibo.com/2870219257/BrE8mAZWc) ]
+
+2014-10-15 感谢 @马超Terminal @李沐M @梁斌penny @cswhjiang @许扬逸Dijkstra 等讨论和推荐 parameter server那条还有一个@老师木 起的相关讨论 http://t.cn/R7ALYi5 可以一起看 [ [微博](http://www.weibo.com/5220650532/BrCBLFdk1) ]
+
+> 2014-10-15 @好东西传送门: 机器学习头条 2014-10-14 http://t.cn/R7ALbiR 1)spark和parameter server的讨论 2)Think系列免费电子书 3)@梁斌penny 的电商词库 4)Rob Tibshirani的15小时机器学习教程 5)用计算机视觉分析“韩国小姐”的脸到底有多相似 加长版49条 http://t.cn/R7ALbi8 [ [微博](http://www.weibo.com/5220650532/BrCykCJFk) ]
+
+2014-10-15 机器学习头条 2014-10-14 http://t.cn/R7ALbiR 1)spark和parameter server的讨论 2)Think系列免费电子书 3)@梁斌penny 的电商词库 4)Rob Tibshirani的15小时机器学习教程 5)用计算机视觉分析“韩国小姐”的脸到底有多相似 加长版49条 http://t.cn/R7ALbi8 [ [微博](http://www.weibo.com/5220650532/BrCykCJFk) ]
+
+2014-10-15 补充一下: 网易的公开课指Ng在斯坦福CS229的课程视频,有中文字幕 http://t.cn/arei5O 而Ng在Coursera 的课是简化版 http://t.cn/RPZBPZL //@好东西传送门: Ng机器学习课的网易公开课网址 http://t.cn/h5n6lh [ [微博](http://www.weibo.com/5220650532/BrCqD9lKD) ]
+
+> 2014-10-14 @cswhjiang: http://t.cn/Rh8103q In-depth introduction to machine learning in 15 hours of expert videos。Trevor Hastie 和 Rob Tibshirani 大神的课。适合初学者。 [ [微博](http://www.weibo.com/2358675560/BrsfHi0vv) ]
+
+2014-10-15 Ng机器学习课的网易公开课网址 http://t.cn/h5n6lh //@phunter_lau: 这不是这两位大爷的在线公开课么,这个基于统计角度的机器学习课倒是不太适合无基础的初学者也不是速成,学过Andrew Ng的机器学习课程想深入一些的可以看看 [ [微博](http://www.weibo.com/5220650532/BrChTb200) ]
+
+> 2014-10-14 @cswhjiang: http://t.cn/Rh8103q In-depth introduction to machine learning in 15 hours of expert videos。Trevor Hastie 和 Rob Tibshirani 大神的课。适合初学者。 [ [微博](http://www.weibo.com/2358675560/BrsfHi0vv) ]
+
+2014-10-15 //@phunter_lau: 这不是这两位大爷的在线公开课么,这个基于统计角度的机器学习课倒是不太适合无基础的初学者也不是速成,学过Andrew Ng的机器学习课程想深入一些的可以看看//@好东西传送门: 15小时学习机器学习.Tibshirani是经典Elements of Statistical Learning的作者 [ [微博](http://www.weibo.com/5220650532/BrCh3rZE9) ]
+
+> 2014-10-14 @cswhjiang: http://t.cn/Rh8103q In-depth introduction to machine learning in 15 hours of expert videos。Trevor Hastie 和 Rob Tibshirani 大神的课。适合初学者。 [ [微博](http://www.weibo.com/2358675560/BrsfHi0vv) ]
+
+2014-10-15 15小时学习机器学习.Tibshirani是经典Elements of Statistical Learning的作者.这个教程是基于他们的新书An Introduction to Statistical Learning with Applications in R (ISLR). [ [微博](http://www.weibo.com/5220650532/BrCekcOJU) ]
+
+> 2014-10-14 @cswhjiang: http://t.cn/Rh8103q In-depth introduction to machine learning in 15 hours of expert videos。Trevor Hastie 和 Rob Tibshirani 大神的课。适合初学者。 [ [微博](http://www.weibo.com/2358675560/BrsfHi0vv) ]
+
+2014-10-14 //@聪老师ZJU永远马屁精:这个讨论非常有意思。第一个人问的问题也是我一直以来的问题。ELM在learning领域太非主流了,发明人把它搞成了一个极小的圈子,供大家一起水文章。除了MSR的邓力,没听任何在learning界有所建树的牛人提过ELM。 [ [微博](http://www.weibo.com/5220650532/BrxgKiOYX) ]
+
+> 2014-10-14 @好东西传送门: 问: 有没有仔细介绍极限学习机ELM和S变换的文章,最好是中文的 答: 资料汇总 http://t.cn/R7wPJYa 网上社区 http://t.cn/R7wPJYS 有代码教程及年会信息。matlabsky 有两个中文资源列表。注意到reddit上学术争议 http://t.cn/R7wPJYK 猜测“ELM是 SVM with a random inflationary kernel" 敬请指点 [ [微博](http://www.weibo.com/5220650532/Brw09AHEV) ]
+
+2014-10-14 转发微博 [ [微博](http://www.weibo.com/5220650532/BrxdTBPJP) ]
+
+> 2014-10-14 @冯志伟文化博客: 回复@泛黄的鹿 对博文【关于斯坦福句法剖析器 -- 答网友】的评论:"Stanford Parser使用了SPSG(统计短语结构语法),没有考虑单词的特征,所以,不是词汇化的SPSG模型(Lixicalized SPSG)。 v 冯志伟"查看原文:http://t.cn/aoig2Z [ [微博](http://www.weibo.com/1926267847/Brxa5b0Pb) ]
+
+2014-10-14 不错的起步教程。传送门直达 http://t.cn/R7wfRwD [ [微博](http://www.weibo.com/5220650532/Brxdyl6Nn) ]
+
+> 2014-10-14 @cnodejs: Redis快速入门教程 http://t.cn/R7Z0WNO [ [微博](http://www.weibo.com/1958172255/BrxcaEez1) ]
+
+2014-10-14 自然语言处理的靠谱公司,帮转 //@李志飞AI:跪求Android,iOS以及其他工程师,请大家帮忙转发扩散。简历可直接发我邮箱zfli@mobvoi.com,优先处理! [ [微博](http://www.weibo.com/5220650532/BrxaXjcY5) ]
+
+> 2014-10-14 @出门问问: #出门问问招聘啦#几十年前,如果你说要改变世界,得到的答复很可能是“呵呵”;但今天,如果你说你要改变世界,没有人敢嘲笑你。让“改变世界”变得可信的,是一群叫做“工程师”的人。如果你也有同样的梦想,快快加入我们的队伍吧![来]http://t.cn/R7whlVj [ [微博](http://www.weibo.com/3411134394/BrwarAjEE) ]
+
+2014-10-14 问: 有没有仔细介绍极限学习机ELM和S变换的文章,最好是中文的 答: 资料汇总 http://t.cn/R7wPJYa 网上社区 http://t.cn/R7wPJYS 有代码教程及年会信息。matlabsky 有两个中文资源列表。注意到reddit上学术争议 http://t.cn/R7wPJYK 猜测“ELM是 SVM with a random inflationary kernel" 敬请指点 [ [微博](http://www.weibo.com/5220650532/Brw09AHEV) ]
+
+2014-10-14 是这本书吧 http://t.cn/R7ZFBQe 2012 年 @高哲遠_StonyBrook_CS 同学曾经尝试翻译了一些章节, http://t.cn/RvHjRLs //@MOJUN: 话说,就没人翻译那本经典《Pattern Recognition And Machine Learning》吗? [ [微博](http://www.weibo.com/5220650532/BrvQ47iwh) ]
+
+> 2014-10-14 @好东西传送门: [温故而知新] 免费电子书 Green tea press 上有 Think Python, Think Bayes, Think Complexity, Think Stats2 等一系列 Allen Downey 撰写的教材,下载链接 http://t.cn/hG9XvF Github有一些书的tex源码例子,相关资料请看合集 http://t.cn/R7ZmB4s @图灵社区 2011年曾推荐过 [ [微博](http://www.weibo.com/5220650532/Brv6gmKco) ]
+
+2014-10-14 期待梁总的分享链接 [ [微博](http://www.weibo.com/5220650532/BrvJbmyRW) ]
+
+> 2014-10-14 @梁斌penny: 最近有不少科研机构找我要电商词库,用于科学研究,我们曾经做过30万个细分的小类的电商词(合计8.6亿词汇),包括类号,词,和词频,如下图。 这样吧,一会我们在pennyjob中拿1万个小类(500万词)分享下,写论文肯定是够了。 [ [微博](http://www.weibo.com/1497035431/BruLAwTwB) ]
+
+2014-10-14 很多人问到怎么订阅<机器学习日报>.为方便大家,做了个订阅按钮在主页上,域名 ml.memect.com http://t.cn/R7ZepFz .或给 hao@memect.com 发封空信,标题是 " 订阅机器学习日报 " 即可.另外,过去几期长短版的链接都加到主页上了. [ [微博](http://www.weibo.com/5220650532/BrvCDmx41) ]
+
+2014-10-14 //@星空下的巫师: 去年ImageNet的第一名Zeiler&Fergus的论文有提到,今年VGG的论文Very Deep Convolutional Networks for Large-Scale Image Recognition的Part 5也有较详细的描述,可以去看看。 [ [微博](http://www.weibo.com/5220650532/Brvg8DUBh) ]
+
+> 2014-10-14 @姜文晖061: 有一个很弱的问题,ImageNet竞赛中,分类和定位是一个Task,可为什么大家的论文里为啥都只说分类,没说怎么用那个网络做定位。是因为太简单了,只有我不知道么?请指教[泪] @星空下的巫师 @ICT秦磊 @丕子 @欢乐的陈奇 @JOSHUA的时间轴 @孙炜晨 @木乱人先生 @好东西传送门 [ [微博](http://www.weibo.com/1254045914/BruIK9lEL) ]
+
+2014-10-14 [good] 期待!//@许扬逸Dijkstra: ThinkBayes中译版已经完成翻译,译者不才正是在下[黑线]。应该最近就会由人民邮电社出版。敬请期待! [ [微博](http://www.weibo.com/5220650532/Brv8Tcsrv) ]
+
+> 2014-10-14 @好东西传送门: [温故而知新] 免费电子书 Green tea press 上有 Think Python, Think Bayes, Think Complexity, Think Stats2 等一系列 Allen Downey 撰写的教材,下载链接 http://t.cn/hG9XvF Github有一些书的tex源码例子,相关资料请看合集 http://t.cn/R7ZmB4s @图灵社区 2011年曾推荐过 [ [微博](http://www.weibo.com/5220650532/Brv6gmKco) ]
+
+2014-10-14 [温故而知新] 免费电子书 Green tea press 上有 Think Python, Think Bayes, Think Complexity, Think Stats2 等一系列 Allen Downey 撰写的教材,下载链接 http://t.cn/hG9XvF Github有一些书的tex源码例子,相关资料请看合集 http://t.cn/R7ZmB4s @图灵社区 2011年曾推荐过 [ [微博](http://www.weibo.com/5220650532/Brv6gmKco) ]
+
+2014-10-14 感谢@火光摇曳Flickering @孙茂松 @机器学习讲座 @丕子 @任远AI 的推荐和精彩评论 [ [微博](http://www.weibo.com/5220650532/BrtOP7HJJ) ]
+
+> 2014-10-14 @好东西传送门: 机器学习头条 2014-10-13 http://t.cn/R7ZSYyw 1)转化率预估-2 逻辑回归技术 2)全国计算语言学学术会议10月18—19日在华中师大召开 3)A*搜索算法的可视化短教程 4)caffestudy(2)关于forward和backward-backward 5)natural language generation经典工作和方法 加长版46条 http://t.cn/R7ZSYy4 [ [微博](http://www.weibo.com/5220650532/BrtOalpeL) ]
+
+2014-10-14 机器学习头条 2014-10-13 http://t.cn/R7ZSYyw 1)转化率预估-2 逻辑回归技术 2)全国计算语言学学术会议10月18—19日在华中师大召开 3)A*搜索算法的可视化短教程 4)caffestudy(2)关于forward和backward-backward 5)natural language generation经典工作和方法 加长版46条 http://t.cn/R7ZSYy4 [ [微博](http://www.weibo.com/5220650532/BrtOalpeL) ]
+
+2014-10-14 回复@星轨1202110: ml.memect.com http://t.cn/R7ZiLYP 那里可以订阅 //@星轨1202110:新人 想知道 在哪里看机器学习 日报 [ [微博](http://www.weibo.com/5220650532/BrtmkE8Vx) ]
+
+> 2014-10-13 @好东西传送门: 机器学习日报做了20多期,有人喜欢短版,有人喜欢长版.目前邮箱只投放短版.咱来投个票,看如果改投长版的话(5条焦点摘要还会保留),大家还会喜欢吗? 短版例子 http://t.cn/R7zcNTQ 长版例子 http://t.cn/R7zVGyO 【你希望机器学习日报邮件发短版还是长版?】,地址 http://t.cn/R7zcJJm [ [微博](http://www.weibo.com/5220650532/BrmF4rriA) ]
+
+2014-10-14 回复@IT教师: 给 hao@memect.com 发封空信,标题 订阅机器学习日报 //@IT教师:怎么加入邮件列表? //@好东西传送门:52:20 长版领先.这个投票再保留一天,同时我们也在邮件列表里咨询大家意见了.如果需要切换,我们会先征求一些用户测试,看看长版的实际效果如何.谢谢已经投过票的朋友们! [ [微博](http://www.weibo.com/5220650532/BrsYPihzo) ]
+
+> 2014-10-13 @好东西传送门: 机器学习日报做了20多期,有人喜欢短版,有人喜欢长版.目前邮箱只投放短版.咱来投个票,看如果改投长版的话(5条焦点摘要还会保留),大家还会喜欢吗? 短版例子 http://t.cn/R7zcNTQ 长版例子 http://t.cn/R7zVGyO 【你希望机器学习日报邮件发短版还是长版?】,地址 http://t.cn/R7zcJJm [ [微博](http://www.weibo.com/5220650532/BrmF4rriA) ]
+
+2014-10-14 52:20 长版领先.这个投票再保留一天,同时我们也在邮件列表里咨询大家意见了.如果需要切换,我们会先征求一些用户测试,看看长版的实际效果如何.谢谢已经投过票的朋友们! [ [微博](http://www.weibo.com/5220650532/BrsViF8iK) ]
+
+> 2014-10-13 @好东西传送门: 机器学习日报做了20多期,有人喜欢短版,有人喜欢长版.目前邮箱只投放短版.咱来投个票,看如果改投长版的话(5条焦点摘要还会保留),大家还会喜欢吗? 短版例子 http://t.cn/R7zcNTQ 长版例子 http://t.cn/R7zVGyO 【你希望机器学习日报邮件发短版还是长版?】,地址 http://t.cn/R7zcJJm [ [微博](http://www.weibo.com/5220650532/BrmF4rriA) ]
+
+2014-10-14 回复@lp_挖掘机:给hao@memect.com发封空信,标题是 订阅机器学习日报 就可以了//@lp_挖掘机:回复@好东西传送门:怎么订阅这个? [ [微博](http://www.weibo.com/5220650532/BrqqtBypL) ]
+
+> 2014-10-13 @lp_挖掘机: 我参与了@好东西传送门 发起的投票【你希望机器学习日报邮件发短版还是长版?】,我投给了“长版,所有的东西都在邮件里,踏实,好找”这个选项。你也快来表态吧:http://t.cn/R7zcJJm [ [微博](http://www.weibo.com/2033610034/BroaixZhv) ]
+
+2014-10-13 //@王威廉:[good] 主题演讲和知识图谱研讨会的内容都很有意思,有条件的同学争取去学习一下。 //@刘知远THU: NLP全国年度盛会。:) @王威廉 @丕子 @龙星镖局 @好东西传送门 [ [微博](http://www.weibo.com/5220650532/Brqk9tX0v) ]
+
+> 2014-10-13 @孙茂松: “第十三届全国计算语言学学术会议”(CCL 2014)和 “第二届基于自然标注大数据的自然语言处理国际学术研讨会”(NLP-NABD 2014)将于今年10月18—19日在华中师大召开。大会特邀报告汇聚了四位国内外大牌学者,涵盖自然语言处理、认知及机器学习多个深刻话题。欢迎注册参加! http://t.cn/8sMoDdb [ [微博](http://www.weibo.com/1970879995/Bro598xvT) ]
+
+2014-10-13 推荐A*搜索算法的可视化短教程 http://t.cn/R7zO4To A*搜索是人工智能基本算法,用于高效地搜索图中两点的最佳路径, 核心是 g(n)+h(n): g(n)是从起点到顶点n的实际代价,h(n)是顶点n到目标顶点的估算代价。下图看优点: 选择最佳路径,同时降低搜索代价(不遍历所有格子) 合集 http://t.cn/R7zO4TK [ [微博](http://www.weibo.com/5220650532/BrnTyvnCT) ]
+
+2014-10-13 大家可以到issue254围观讨论精华区 http://t.cn/R7zomOr //@青圩小康: 转发微博 [ [微博](http://www.weibo.com/5220650532/BrnqxfpMe) ]
+
+> 2014-10-13 @丕子: natural language generation 经典工作和方法? @好东西传送门 [ [微博](http://www.weibo.com/1665335994/Brl62dza9) ]
+
+2014-10-13 //@任远AI: 我校的NLG组号称世界最大,两位教授Ehud和Yaji创建了很成功的NLG公司 http://t.cn/R7zocR9 。在我校的NLP课程 http://t.cn/R7zocRC 后半有Ehud讲授的NLG内容。爱丁堡有专门的NLG课程 http://t.cn/R7zocRK ,里面有完整的讲义和大量延伸阅读材料。会议的话看INLG( http://t.cn/R7zocRo [ [微博](http://www.weibo.com/5220650532/BrnoGjaZe) ]
+
+> 2014-10-13 @丕子: natural language generation 经典工作和方法? @好东西传送门 [ [微博](http://www.weibo.com/1665335994/Brl62dza9) ]
+
+2014-10-13 @丕子 问:natural language generation 经典工作和方法?答:BBN的David D. McDonald在NLP Handbook里有一章Natural Language Generation(自然语言生成),有20多页,讲得很全面.文后附了很多参考文献,经典的工作应该都涵盖了 http://t.cn/R7zaBVI [ [微博](http://www.weibo.com/5220650532/BrniQD1hW) ]
+
+
+2014-10-13 机器学习日报做了20多期,有人喜欢短版,有人喜欢长版.目前邮箱只投放短版.咱来投个票,看如果改投长版的话(5条焦点摘要还会保留),大家还会喜欢吗? 短版例子 http://t.cn/R7zcNTQ 长版例子 http://t.cn/R7zVGyO 【你希望机器学习日报邮件发短版还是长版?】,地址 http://t.cn/R7zcJJm [ [微博](http://www.weibo.com/5220650532/BrmF4rriA) ]
+
+2014-10-13 在手机上可以看世行数据了:MacroStats to Go(世行宏观统计数据).另外搭车推一遍我们整理的数据集目录,一共20个http://t.cn/R7z5ErQ 世行数据也在其中 [ [微博](http://www.weibo.com/5220650532/BrmxneNDH) ]
+
+> 2014-10-12 @世界银行: #世界银行2014年秋季年会# 如果您下次访问苹果商店,请考虑下载一个既可供您娱乐又给您提供信息的应用程序吧[哈哈]。世行在年会召开之际推出MacroStats to Go(世行宏观统计数据)应用程序,将世界上最大的经济数据库之一的数据置于您手掌之中,快去下载吧,好处你知道哈[阴险]。http://t.cn/R7hLqRi [ [微博](http://www.weibo.com/1735501411/Brb5U04dp) ]
+
+2014-10-13 这本书也不错,推荐一下.英文原版R in a Nutsbell http://t.cn/R7zGAhJ [ [微博](http://www.weibo.com/5220650532/Brmmu3vDv) ]
+
+> 2014-08-26 @互动出版网china-pub: #新书到货#《R语言核心技术手册(第2版)》面向统计计算与数据可视化 业界公认R语言最佳入门 覆盖领域最全实战案例最多 数据从业者案头必备工具书。内容新增了R高性能计算、基于ggplot2的数据可视化和利用Hadoop做并行运算。本书详情:http://t.cn/RPg4urU @电子工业出版社 @刘思喆 [ [微博](http://www.weibo.com/1645536727/Bk2fPccrt) ]
+
+2014-10-13 好东西.更多关于ipython的资料 http://t.cn/R77F8w7 [ [微博](http://www.weibo.com/5220650532/Brlt3clvm) ]
+
+> 2014-10-13 @squirrel_d: ipython notebook格式的一本书,讲述如何用python进行统计分析,内容包括mcmc,hanmiltonian MC,高斯过程,狄利克莱过程等 http://t.cn/R77ulSW [ [微博](http://www.weibo.com/1978391022/BrkRxkxV4) ]
+
+2014-10-13 感谢最右.欢迎更多建议,我会帮着整理讨论合集和增补 //@Copper_PKU: http://t.cn/R77gFV4 给你推荐一个 我曾经参加过summer school 这个人讲了NLG的一些技术 [ [微博](http://www.weibo.com/5220650532/BrlrQoLjy) ]
+
+> 2014-10-13 @丕子: natural language generation 经典工作和方法? @好东西传送门 [ [微博](http://www.weibo.com/1665335994/Brl62dza9) ]
+
+2014-10-13 CommonCrawl简介.把以前几条和CommonCrawl这个巨大的数据集相关的微博汇总了一下.这个数据集对各行各业的人应该都有用,和Wikipedia类似.文字版 http://t.cn/R77RbnD [ [微博](http://www.weibo.com/5220650532/BrkAx26eT) ]
+
+2014-10-13 是一个有50亿网页的搜索索引 http://t.cn/RPIJ8V9 //@李立辉lilihui: Commoncrawl是什么?见我们以前的推荐 http://t.cn/R77QeUA http://t.cn/R77QeUw [ [微博](http://www.weibo.com/5220650532/Brkvz8DQq) ]
+
+> 2014-08-30 @好东西传送门: 问: @小磊_DM_中二青年 在学搜索,请问有Nutch的相关资料吗? 答: nutch主要做网络爬虫,可以和solr结合做搜索引擎。问答进展: http://t.cn/RhZN72R (卡片盒子 http://t.cn/RhZN72E 6个资源): nutch 的中英文安装短教程(此外看Nutch wiki); nutch工作流程; 最近很火的CommonCrawl也转用nutch [ [微博](http://www.weibo.com/5220650532/BkFg8v2lw) ]
+
+2014-10-13 感谢@蒋涛CSDN @cvnote计算机视觉笔记 @极度视界 @breezedeus 的推荐 开源版数据科学教程 尤其赞,收集了各方向近20门课程,在家就可以自学数据科学硕士 [ [微博](http://www.weibo.com/5220650532/BrkkkkQcV) ]
+
+> 2014-10-13 @好东西传送门: 机器学习头条 2014-10-12 http://t.cn/R77YEFk 1)开源版数据科学教程 2)usaddress解析自然语言描述的美国地址字符串 3)NEIL: Never Ending Image Learning 4)ASR corpus开放语音语料库 5)特征选择要点清单 加长版50条 http://t.cn/R77YEFF [ [微博](http://www.weibo.com/5220650532/BrkiB5rjZ) ]
+
+2014-10-13 机器学习头条 2014-10-12 http://t.cn/R77YEFk 1)开源版数据科学教程 2)usaddress解析自然语言描述的美国地址字符串 3)NEIL: Never Ending Image Learning 4)ASR corpus开放语音语料库 5)特征选择要点清单 加长版50条 http://t.cn/R77YEFF [ [微博](http://www.weibo.com/5220650532/BrkiB5rjZ) ]
+
+2014-10-12 [开源软件] usaddress 利用机器学习将自然语言描述的美国地址字符串解析为结构化数据, python 包, github 近200星。分词用正则表达式, 机器学习用 Conditional Random Fields (pyCRFsuite) 源码: http://t.cn/R7hCJbY 相关资料 http://t.cn/R7hCJbj [ [微博](http://www.weibo.com/5220650532/Brdr2jdUJ) ]
+
+2014-10-12 作者 Scott Krig http://t.cn/R7hiMF2 [ [微博](http://www.weibo.com/5220650532/BrcEAluXE) ]
+
+> 2014-10-11 @cvnote计算机视觉笔记: 好书推荐 | Computer Vision Metrics, Survey, Taxonomy and Analysis | Scott Krigs 2014最新作品,对目前流行的计算机视觉算法进行了深入浅出的讲解,包括各种图像特征描述方法、图像成像原理、距离度量、视觉算法开发的整体优化等等。最重要的是:电子版是免!费!的!http://t.cn/R7Ppb1k [ [微博](http://www.weibo.com/3812841100/Br69QEhaS) ]
+
+2014-10-12 好东西周报+一周的机器学习头条 总结已经发出了 http://t.cn/R7hJWhZ 过去一周我们推荐的好东西统统在这里.和以前一样Github已经同步更新 http://t.cn/RPfAgNg [ [微博](http://www.weibo.com/5220650532/BrcAeg0bC) ]
+
+2014-10-12 把这条单独拿出来推一下,看看搞spark的和multiboost的朋友们有什么建议? [ [微博](http://www.weibo.com/5220650532/BrbttvbrZ) ]
+
+> 2014-10-11 @BaiGang-: 十一之后对Spark MultiBoost做了些调整 http://t.cn/R7Pp3K3, 现在支持用mllib中的SVM和LR作为general base learner,比之前的decision stump model在训练效率上和效果上都提高了很多。欢迎fork&star http://t.cn/RhI1RB3 [熊猫] [ [微博](http://www.weibo.com/2149737874/Br6dqz8US) ]
+
+2014-10-12 感谢推荐者@eeyangc @上微博的猫V @Python开发者 @网路冷眼 今天的5条之外还有不错的前沿新闻,如@velvel2 推荐的Not All Neural Embeddings are Born Equal结合语言模型和翻译模型 @BaiGang- 开源的Spark MultiBoost 都在加长版中 http://t.cn/R7hy8gY [ [微博](http://www.weibo.com/5220650532/BrblmzWSf) ]
+
+> 2014-10-12 @好东西传送门: 机器学习头条 2014-10-11 http://t.cn/R7hy8gT 1)好书Freedman的statistical models theory and practice 2)Netflix技术分享的资源17条 3)一张图的故事概率分布之间的关系(下) 4)scikit-learn用于机器学习的Python模块 5) Spark打破了MapReduce排序世界记录 加长版69条 http://t.cn/R7hy8gY [ [微博](http://www.weibo.com/5220650532/Brbft2DRe) ]
+
+2014-10-12 推荐这篇!可结合读@AixinSG 推荐的如何选择最适合的推荐模型 http://t.cn/R7hU5co @xccds 推荐的特征工程的方方面面 http://t.cn/RhdVoZT [ [微博](http://www.weibo.com/5220650532/BrbiQiyJT) ]
+
+> 2014-10-11 @breezedeus: 特征工程在具体项目里的作用其实比算法大的多,换个角度说,算法可以认为是用来提取特征的。强烈推荐这篇讲特征选择的博文,进去后你会发现,文章论及的远不止特征选择。而且附带了丰富的参考文献,甚至处理具体问题的详细步骤。http://t.cn/R7PEiL5 [ [微博](http://www.weibo.com/1660835355/Br7jD5zSQ) ]
+
+2014-10-12 机器学习头条 2014-10-11 http://t.cn/R7hy8gT 1)好书Freedman的statistical models theory and practice 2)Netflix技术分享的资源17条 3)一张图的故事概率分布之间的关系(下) 4)scikit-learn用于机器学习的Python模块 5) Spark打破了MapReduce排序世界记录 加长版69条 http://t.cn/R7hy8gY [ [微博](http://www.weibo.com/5220650532/Brbft2DRe) ]
+
+2014-10-11 fuxi是一个很不错的推理引擎。 [ [微博](http://www.weibo.com/5220650532/Br4NK9ZoN) ]
+
+> 2014-10-11 @潘越_: FuXi http://t.cn/R7Pfso7 很不错,可惜没有人维护了,不支持rdflib 4.x和Python 3.x [ [微博](http://www.weibo.com/1860270543/Br4MVhRog) ]
+
+2014-10-11 昨天 @龙星镖局 推荐了Netflix个性化和推荐系统架构。这里我们收集了Memect的用户们分享的更多的关于Netflix技术分享的资源,一共17条,涉及推荐系统方法,大数据平台,开源系统等。特别推荐《Netflix视频推荐的背后:算法知道你想看什么》《Big Data Lessons From Netflix》http://t.cn/R7Pqfw3 [ [微博](http://www.weibo.com/5220650532/Br4iGoZ8D) ]
+
+2014-10-11 http://t.cn/h4PrxS 斯坦福哲学百科全书。虽然听起来有点玄,其实里面有很多和数学、计算机科学相关的内容,例如和逻辑相关的有近百条,还有语言学、概率论、脑与认知等很多精彩条目,有益开拓眼界。(另附一张西方哲学系谱图) [ [微博](http://www.weibo.com/5220650532/Br3Ryaa62) ]
+
+2014-10-11 LISP里有强大的宏,用MacroPy在Python里也可以实现。例如LINQ风格的数据查询语言。用宏可以自己来发明语言了。人生苦短... [ [微博](http://www.weibo.com/5220650532/Br3z4gkVl) ]
+
+> 2014-10-11 @好东西传送门: 接上面的Python函数式编程的讨论.已经发明的轮子主要有这几个:标准库里的functools http://t.cn/R7Pw9ne fn.py 见@InfoQ 的这篇文章 http://t.cn/zY1VzLx gf定义通用函数 http://t.cn/R7Pw9nD MacroPy宏语言http://t.cn/R7Pw9nk 此外还有 pyfunctor funcy toolz [ [微博](http://www.weibo.com/5220650532/Br3xP8En6) ]
+
+2014-10-11 接上面的Python函数式编程的讨论.已经发明的轮子主要有这几个:标准库里的functools http://t.cn/R7Pw9ne fn.py 见@InfoQ 的这篇文章 http://t.cn/zY1VzLx gf定义通用函数 http://t.cn/R7Pw9nD MacroPy宏语言http://t.cn/R7Pw9nk 此外还有 pyfunctor funcy toolz [ [微博](http://www.weibo.com/5220650532/Br3xP8En6) ]
+
+2014-10-11 谁来写写萝莉分布(Rayleigh distribution) [哈哈] //@we1559: 原po好腐。。。正态分布能打成正太分布 //@好东西传送门: 博主的(下)来了[good]. (上) 的微博: http://t.cn/R7vkfIY [ [微博](http://www.weibo.com/5220650532/Br3kM6cck) ]
+
+> 2014-10-11 @上微博的猫V: 【一张图的故事——概率分布之间的关系(下)】 图中概率分布之间的转化关系大致可以分成三种:1.近似关系,如正太分布可以用来近似泊松分布、二项分布和伽马分布。2.变量变换关系,如随机变量X服从均匀分布U(0,1), 则−θlnX服从指数分布。 3.特例关系,如卡方分布是伽马分布...http://t.cn/R7vmBGH [ [微博](http://www.weibo.com/1679022231/Br2cNlIcH) ]
+
+2014-10-11 赞.搭车推荐一个python函数式编程的报fn http://t.cn/zTHOud5 可以非常简明又易懂地实现很多函数式编程,如简化的lambda定义,序列流,尾递归,很多高级的数据遍历操作(几乎可以理解为Python上定义的一个数据查询语言),强大[威武] [ [微博](http://www.weibo.com/5220650532/Br3iBEi5o) ]
+
+> 2014-10-11 @申导: 拙作 《Python函数式编程》,记录了自己一点学习心得。 http://t.cn/R7vgeUp [ [微博](http://www.weibo.com/1001863751/Br2wPjdPB) ]
+
+2014-10-11 博主的(下)来了[good]. (上) 的微博:http://t.cn/R7vkfIY 另外再感谢一次@_散沙_民工智能_ 最早发现和分享了这张图 [ [微博](http://www.weibo.com/5220650532/Br2IfD5Zk) ]
+
+> 2014-10-11 @上微博的猫V: 【一张图的故事——概率分布之间的关系(下)】 图中概率分布之间的转化关系大致可以分成三种:1.近似关系,如正太分布可以用来近似泊松分布、二项分布和伽马分布。2.变量变换关系,如随机变量X服从均匀分布U(0,1), 则−θlnX服从指数分布。 3.特例关系,如卡方分布是伽马分布...http://t.cn/R7vmBGH [ [微博](http://www.weibo.com/1679022231/Br2cNlIcH) ]
+
+2014-10-11 感谢头条的作者和推荐者们 @龙星镖局 @InfoQ @zhujiangmail @网路冷眼 .今天Netflix的案例可以结合前天Josh Wills讲工业界和学术界机器学习的异同那条看,系统优先于算法 http://t.cn/R7vOofL [ [微博](http://www.weibo.com/5220650532/Br0xsftsa) ]
+
+> 2014-10-11 @好东西传送门: 机器学习头条 2014-10-10 http://t.cn/R7vNur1 1)Netflix个性化和推荐系统架构 2)Android上的相似图像推荐 3)问答:推荐识别歧义词的方法和文章 4)用Python实现逻辑回归 5)Michael Jordan解析领域中各类模型 加长版62条 [ [微博](http://www.weibo.com/5220650532/BqZYV3Xew) ]
+
+2014-10-11 机器学习头条 2014-10-10 http://t.cn/R7vNur1 1)Netflix个性化和推荐系统架构 2)Android上的相似图像推荐 3)问答:推荐识别歧义词的方法和文章 4)用Python实现逻辑回归 5)Michael Jordan解析领域中各类模型 加长版62条 [ [微博](http://www.weibo.com/5220650532/BqZYV3Xew) ]
+
+2014-10-11 机器学习头条 2014-10-10 http://t.cn/R7vNur1 1)Netflix个性化和推荐系统架构 @龙星镖局 2)Android上的相似图像推荐 @zhujiangmail 3)问答:推荐识别歧义词的方法和文章 4)用Python实现逻辑回归 @好东西传送门 5)Michael Jordan解析领域中各类模型 @网路冷眼 加长版62条 http://t.cn/R7vNur3 [ [微博](http://www.weibo.com/5220650532/BqZSA5k01) ]
+
+2014-10-11 感谢大家@张俊林say @昊奋 @东北大学自然语言处理实验室 @AixinSG 讨论合集已经整理到这里了 http://t.cn/R7vNvt4 [ [微博](http://www.weibo.com/5220650532/BqZFQcE4d) ]
+
+> 2014-10-10 @yuxyang: @好东西传送门 求推荐识别歧义词的方法和文章。比如: 苹果 有苹果手机和苹果这两个意思。金六福有金六福珠宝和金六福酒业这些意思。 如何识别这样的词 并做区分呢? [ [微博](http://www.weibo.com/1727751845/BqVqdnbPI) ]
+
+2014-10-11 //@侠女无敌-曾佩玲: 补充一个很好的 reading list: http://t.cn/8FqFegC //@AixinSG: @LCL-WHU 做过Word Sense Disambiguation (WSD)方面的尝试。判断哪些词可 能有歧义需要一个知识库支持,我们用的是基于Wikipedia建立的语料库;然后根据歧义词语义判断区分 http://t.cn/R7v7tl0 [ [微博](http://www.weibo.com/5220650532/BqYHa0aZX) ]
+
+> 2014-10-10 @yuxyang: @好东西传送门 求推荐识别歧义词的方法和文章。比如: 苹果 有苹果手机和苹果这两个意思。金六福有金六福珠宝和金六福酒业这些意思。 如何识别这样的词 并做区分呢? [ [微博](http://www.weibo.com/1727751845/BqVqdnbPI) ]
+
+2014-10-11 期待王斌老师的中文版! //@马少平THU:又让我们掏银子了//@王斌_IIEIR: 翻译完了校对中,勿喷//@AixinSG [ [微博](http://www.weibo.com/5220650532/BqYGAwjVr) ]
+
+> 2014-10-10 @好东西传送门: Taming Text是一本从实用的角度基于Java处理文本的好书.它包括了文本搜索的原理和用Solr的实现,字符串匹配.实体(如人名地名)识别和OpenNLP实现,文本聚类及工具Carrot//Mahout,文本分类的工具Lucene/Mahout/OpenNLP等 http://t.cn/htf5rQ 源代码http://t.cn/RhsDOce [ [微博](http://www.weibo.com/5220650532/BqViJ8DtN) ]
+
+2014-10-11 Awesome C/C++不错.统计了一下Github上的原文 http://t.cn/R7vSNTo ,大约列了350个资源 [ [微博](http://www.weibo.com/5220650532/BqYFU0u4L) ]
+
+> 2014-10-10 @伯乐头条: 《Github干货系列:C++资源集合》这又是一个 Awesome XXX 系列的资源整理,由 fffaraz 发起和维护。内容包括:标准库、Web应用框架、人工智能、数据库、数据可视化、图片处理、机器学习、日志、代码分析等。http://t.cn/R7vhj7w [ [微博](http://www.weibo.com/3844704614/BqWyixLV0) ]
+
+2014-10-10 赞好奇猫团队的杰出翻译,主译者是美女Billie Zhang http://t.cn/Rhsksfv [ [微博](http://www.weibo.com/5220650532/BqVq9uNIO) ]
+
+> 2014-10-10 @Easy: 一直不会shell编程,mark下来回头读。《Linux命令行》中文版,http://t.cn/zQG7kxb 目录见大图 PDF @微盘 下载 http://t.cn/RhskyeL [ [微博](http://www.weibo.com/1088413295/BqVlRzWjg) ]
+
+2014-10-10 约翰霍普金斯大学JHU作为自然语言处理的一个重镇,其CLSP Seminars广邀重要学者讲学.例如近三期是Isidoros Doxa讲LSA, Jackie CK Cheung讲分布式语义,Yoshua Bengio讲生成模型的深度学习.多年来400多个讲座都在这里.关键学者和话题,在此一目了然 http://t.cn/RhskULw [ [微博](http://www.weibo.com/5220650532/BqVlSrrjT) ]
+
+2014-10-10 Taming Text是一本从实用的角度基于Java处理文本的好书.它包括了文本搜索的原理和用Solr的实现,字符串匹配.实体(如人名地名)识别和OpenNLP实现,文本聚类及工具Carrot//Mahout,文本分类的工具Lucene/Mahout/OpenNLP等 http://t.cn/htf5rQ 源代码http://t.cn/RhsDOce [ [微博](http://www.weibo.com/5220650532/BqViJ8DtN) ]
+
+2014-10-10 用Python实现逻辑回归Logistic Regression。LR是一种强大而简单的机器学习模型,例如Gmail的收件箱分类就使用了LR算法。这篇文章里Kevin Markham介绍了用scikit-learn实现LR的步骤,综合运用statsmodels pandas matplotlib patsy和scikit-learn,一步步教你如何分析数据与建模 http://t.cn/RhsNbFA [ [微博](http://www.weibo.com/5220650532/BqTn7ax4n) ]
+
+2014-10-10 名字显然是在向《Parallel Distributed Processing》这本经典致敬 http://t.cn/RhsLEzv 那是McClelland自己28年前的书了 [ [微博](http://www.weibo.com/5220650532/BqR442xQy) ]
+
+> 2014-06-13 @王晓伟alex: 分享一本关于分布式并行处理的数据《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。着重介绍了各种神级网络算法的分布式实现,做Distributed Deep Learning 的童鞋可以参考下。网址:http://t.cn/8kltYYT [ [微博](http://www.weibo.com/1932676664/B8MYbbNQy) ]
+
+2014-10-10 总结:@陈佳威_有荷有兰要发光 @哇噻大魔王 推荐ODPS; @陈天奇怪 @范涛_中科大 推荐xgboost http://t.cn/8sVIdCB @irwenqiang 推荐pGBRT http://t.cn/zjaDoYX [ [微博](http://www.weibo.com/5220650532/BqQVI3hLe) ]
+
+> 2014-10-09 @龙星镖局: 求助:有没支持大规模训练的开源GBDT? [ [微博](http://www.weibo.com/1830516311/BqNjVsVPX) ]
+
+
+----
+
+2014-10-09 @Mindey 君对SageMath云平台计算环境的介绍更赞,有优酷视频 http://t.cn/RhF9Ma8 //@Mindey: It is awesome tool indeed! [ [微博](http://www.weibo.com/5220650532/BqLSGDu6S) ]
+
+> 2014-10-09 @好东西传送门: Sage是一个Python的强大的数学工具箱合集,基本上常见数学计算都有支持:代数方程,微积分,微分方程,多项式,线性代数,群论,数论,拓扑学代数几何,椭圆曲线,可视化....详细列表见长微博。相比某其他软件要上万块才能有的专业包,Sage是个不错的选择。手册 http://t.cn/RhFK6tr [ [微博](http://www.weibo.com/5220650532/BqLO71d2P) ]
+
+
+2014-10-09 机器学习头条 2014-10-08 http://t.cn/RhFwt4M 亚马逊提供的海量公共数据集等5条,见长微博。感谢@52cs @Geffory_ima @lidingpku @黄小非 [ [微博](http://www.weibo.com/5220650532/BqKiR7u0Q) ]
+
+2014-10-09 2)广告系统工程师谈工业界与学术界机器学习的异同 @52cs [ [微博](http://www.weibo.com/5220650532/BqKcNegej) ]
+
+2014-10-09 LingPipe非常值得考虑。项目主页 http://t.cn/RhF7H2U 而且有一本很不错的307页的免费电子书 http://t.cn/RhF7H24 [ [微博](http://www.weibo.com/5220650532/BqJHy2bg9) ]
+
+> 2014-10-08 @ImportNew: 《计算语言工具包LingPipe》LingPipe是一个开源的NLP计算语言工具包,采用Java书写,支持多语言,多领域,多类型的语言处理功能(包括中文分词),并提供Eclipse插件。http://t.cn/Rh37RdQ @黄小非 分享 [ [微博](http://www.weibo.com/2991905905/Bqze22laq) ]
+
+2014-10-09 过去多年的Web上的知识管理的文章尽在其中。想了解知识图谱,语义搜索等的来龙去脉,不能不过目。而且有完整的元数据!很容易开发出新的有趣的应用。可参考ISWC 2010的应用 http://t.cn/zjau1FF [ [微博](http://www.weibo.com/5220650532/BqJD3CB1S) ]
+
+> 2014-10-08 @lidingpku: International Semantic Web Conference - ISWC 2014 (10月18至23) 的全部论文(公开访问preprint PDF) 已经上传到github上了,http://t.cn/RhDmjvw 历年(2001-2014)相关的元数据(RDF,JSON, CSV格式) 也整理好了,可以下载 http://t.cn/RhDmjvA 大家有空挑挑错吧 [ [微博](http://www.weibo.com/5219449194/BqB6iy0rF) ]
+
+2014-10-09 推荐系统前沿必读。DBLP的列表页更好用 http://t.cn/RhFPLGl 每篇文章都有pdf下载 [ [微博](http://www.weibo.com/5220650532/BqJwqls9C) ]
+
+> 2014-10-09 @疯狂的雪SDU: Proceedings of the 8th ACM Conference on Recommender Systems #RecSys2014# is available. http://t.cn/Rhkkqqc [ [微博](http://www.weibo.com/2174081740/BqJfqheeD) ]
+
+2014-10-09 //@星空下的巫师: 原话是:kind of going against what people in research have been finding, but that’s what makes it interesting @董力at北航 @鲁东东胖 [ [微博](http://www.weibo.com/5220650532/BqJqCpmr7) ]
+
+> 2014-10-09 @BigData大数据: #OSDI2014#第一篇DL 微软的ADAM系统 彻底把Lecun 革命了 这个Imagine Net准确率提高的有猛 系统的力量真是无限 亮点在最后一张图 Deep Learning Guys 怎么想?@好东西传送门 @深度学习研究院IDL @云泉微博 @中国计算机学会CCF @杨静Lillian @百度技术沙龙 @chengangcs @CCF技术动态 [ [微博](http://www.weibo.com/2870219257/BqFIOpprZ) ]
+
+2014-10-09 CppCon2014,C++最重要的年度会议PPT一览 http://t.cn/RhksQxB 中文导读请看@顾露-Gu_Lu 的http://t.cn/RhksQx3 [ [微博](http://www.weibo.com/5220650532/BqJq98Rzy) ]
+
+2014-10-09 几个要点:系统优先于算法;并不存在清晰的优化目标函数;系统常变人员常变(所以简单可理解非常非常重要);各种折衷,而要产生这些折衷也需要容易理解的方法和结果。 [ [微博](http://www.weibo.com/5220650532/BqGDN1TV0) ]
+
+> 2014-10-08 @52cs: 前Google广告系统工程师Josh Wills 讲述工业界和学术界机器学习的异同,总结的真的好!http://t.cn/RhkU1Sj [ [微博](http://www.weibo.com/5172229575/BqDWNdAZm) ]
+
+2014-10-09 摘要:逻辑回归的并行化最主要的就是对目标函数梯度计算的并行化,可以很容易将每个迭代过程拆分,由不同的节点进行独立计算,然后归并。MPI_L-BFGS实验效果最佳 http://t.cn/SAJ2SN http://t.cn/RhkN3x3 //@孙明明_SmarterChina: @Memect [ [微博](http://www.weibo.com/5220650532/BqFNz0JYP) ]
+
+> 2014-02-12 @fengyoung: 并行逻辑回归: 逻辑回归(Logistic Regression,简称LR)是机器学习中十分常用的一种分类算法,在互联网领域得到了广泛的应用,无论是在广告系统中进行CTR预估,推荐系统中的预估转换率,反垃...文字版>> http://t.cn/8FpoAyz (新浪长微博>> http://t.cn/zOXAaic) [ [微博](http://www.weibo.com/1824056637/AwpIi1ie6) ]
+
+
+----
+
+2014-10-08 今年的OSDI内容很丰富 [ [微博](http://www.weibo.com/5220650532/BqFfbjCfp) ]
+
+> 2014-10-08 @BigData大数据: #OSDI2014#重磅Session来了 做深度学习的 做系统的都不能错过 深度学习的Session 这也是OSDI第一加上深度学习的DL ML的Guy也不能错过 这次的Session Chair 是Rezimi @云泉微博 @云泉微博 @中国计算机学会CCF @Hadoop中国 @好东西传送门 @hashjoin [ [微博](http://www.weibo.com/2870219257/BqFch5Q6W) ]
+
+2014-10-08 其他主要是科学类:儿童人体测量, 80年的按日全球天气,23万种材料安全,NASA的地球卫星地图,OpenStreetMap,石油数据, 2000多种稀疏矩阵,SDSS( @斯隆数字化巡天 ) [ [微博](http://www.weibo.com/5220650532/BqCf4mnKB) ]
+
+2014-10-08 社会与经济类的有:美国1980/1990/2000年人口普查,美国2003-2006经济,美国工商业,美联储经济数据时间序列2万个,日本人口统计,美国劳工部统计,美国交通部各种统计,完整的美国街道名与地址 [ [微博](http://www.weibo.com/5220650532/BqCduygRc) ]
+
+2014-10-08 计算机类的有:Apache基金会邮件列表,Common Crawl50亿网页(以前推荐过),DBpedia结构化知识库,Freebase知识图谱(这三个以前推荐过),安然电子邮件, 4万多个USENET新闻组数,M-Lab的互联网性能诊断,谷歌图书的ngram语言模型 @昊奋 @Gary南京 [ [微博](http://www.weibo.com/5220650532/BqC1qEYkF) ]
+
+2014-10-08 生物类的数据有:人体基因组,千人基因组计划,老鼠杂交数据,丹尼索瓦人基因组, Ensembl真核生物基因组,50个物种的基因序列,GenBank基因银行,Unigene转录组,PubSem有机小分子生物活性,等 [ [微博](http://www.weibo.com/5220650532/BqBYki5zi) ]
+
+> 2014-10-08 @好东西传送门: 《亚马逊提供的海量公共数据集》在大数据分析时,一个困难是存储困难,下载耗时。亚马逊AWS云服务平台上为此提供了很多常用的大规模数据集,从各行业数据到百科数据,无需下载即可在AWS EC2上使用。这里我们介绍了目前在线的五十多个数据集,和如何使用的基本方法。文字版http://t.cn/RhDrPhn [ [微博](http://www.weibo.com/5220650532/BqBtMrKK0) ]
+
+
+2014-10-08 补充:MovieTweetings包含12万条电影的观众评价,收集自7个月的Twitter流,平均每天有500多。项目介绍PPT http://t.cn/RhDgH81 [ [微博](http://www.weibo.com/5220650532/BqBIn0PTy) ]
+
+> 2014-10-07 @AixinSG: 这个数据集看着挺有意思的 MovieTweetings:A Movie Rating Dataset Collected From Twitter http://t.cn/zRqz834 [ [微博](http://www.weibo.com/1025887594/BqvlpfkjW) ]
+
+2014-10-08 《亚马逊提供的海量公共数据集》在大数据分析时,一个困难是存储困难,下载耗时。亚马逊AWS云服务平台上为此提供了很多常用的大规模数据集,从各行业数据到百科数据,无需下载即可在AWS EC2上使用。这里我们介绍了目前在线的五十多个数据集,和如何使用的基本方法。文字版http://t.cn/RhDrPhn [ [微博](http://www.weibo.com/5220650532/BqBtMrKK0) ]
+
+2014-10-08 C++好东西. 博主非常用心,整理了 教程和介绍 (beginner) 思维和理念 (intermediate) 工程实践 (intermediate) 专题 (general) 工具和库 (general) 几大类,篇篇都做了中文导读. [ [微博](http://www.weibo.com/5220650532/BqA4ODaV4) ]
+
+> 2014-09-23 @顾露-Gu_Lu: (Gu Lu's Blog) CppCon2014 分类合辑 & 十大推荐阅读列表 - http://t.cn/RhOPqAu [ [微博](http://www.weibo.com/1752458857/BohlfqkeM) ]
+
+2014-10-08 刚才忘了链接 http://t.cn/RhD0OAz http://t.cn/RhD0OAZ //@好东西传送门: 说的是.Amazon Public Dataset里有两个气象数据集:NASA NEX遥感与卫星数据,和全球(9000多气象站)1929-2009逐日天气数据,直接挂载EC2就能用,连下载都不用 //@大脸撑在小胸: 值得收藏。PS: 麻烦的是下载读取和处理 [ [微博](http://www.weibo.com/5220650532/BqzZrCPHs) ]
+
+> 2014-10-07 @好东西传送门: @IT莲接 推荐的<史上最全的的气象科研数据来源> http://t.cn/Rhgppds 来自@数据堂 , 列举了综合资料库,天气情况,降水资料,全球土壤资料,风场资料,海洋风场,海浪,海表温度,冰芯,台风等50多个数据集 部分数据集我们做了更直观的卡片预览 http://t.cn/RheCw1Z [ [微博](http://www.weibo.com/5220650532/BqrkwDlyl) ]
+
+2014-10-08 说的是.Amazon Public Dataset里有两个气象数据集:NASA NEX遥感与卫星数据,和全球(9000多气象站)1929-2009逐日天气数据,直接挂载EC2就能用,连下载都不用 //@大脸撑在小胸: 值得收藏。PS:气象资料一般来说获取途径并不是大问题,麻烦的是下载读取和处理[doge] [ [微博](http://www.weibo.com/5220650532/BqzelxhW3) ]
+
+> 2014-10-07 @好东西传送门: @IT莲接 推荐的<史上最全的的气象科研数据来源> http://t.cn/Rhgppds 来自@数据堂 , 列举了综合资料库,天气情况,降水资料,全球土壤资料,风场资料,海洋风场,海浪,海表温度,冰芯,台风等50多个数据集 部分数据集我们做了更直观的卡片预览 http://t.cn/RheCw1Z [ [微博](http://www.weibo.com/5220650532/BqrkwDlyl) ]
+
+2014-10-08 @吴楚东南坼乾坤日夜浮 补充了Hunspell http://t.cn/RhDXuOs @西瓜大丸子汤 补充了Enchant和PyEnchant http://t.cn/RhDXuOF 都是比Aspell更进步的拼写检查开源软件 [ [微博](http://www.weibo.com/5220650532/Bqzazf8lB) ]
+
+> 2014-10-07 @好东西传送门: 问:英文语法检测,拼写错误有开源引擎吗?答:拼写检查推荐Aspell http://t.cn/zjfqk4q 语法检查工具这里有列表http://t.cn/RheHWdP 推荐试试Link Grammar http://t.cn/h47cEM 它可检查是不是合乎语法.如果需要自定义的规则,可以把它的结果再过滤一下 [ [微博](http://www.weibo.com/5220650532/BqstnpYCx) ]
+
+----
+
+2014-10-07 python好工具 [ [微博](http://www.weibo.com/5220650532/BqsYRtj2D) ]
+
+> 2014-10-07 @Python开发者: 《Online Python Tutor:Python 初学者的好帮手》一个免费教育工具,可帮助学生攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。通过这个工具,教师或学生可以直接在 Web 浏览器中编写 Python 代码,并一步一步可视化地执行程序……http://t.cn/8kp54hk [ [微博](http://www.weibo.com/5305630013/BqqKcFiJv) ]
+
+2014-10-07 增强现实Augmented Reality对物流企业有什么价值?DHL研发中心最近发布28页的报告,描述了增强现实对快递与后勤产业各环节可能起到的作用:仓储,运输,递送,增值服务等.值得传统企业参考 http://t.cn/Rhe8wMx [ [微博](http://www.weibo.com/5220650532/BqszFssx9) ]
+
+2014-10-07 问:英文语法检测,拼写错误有开源引擎吗?答:拼写检查推荐Aspell http://t.cn/zjfqk4q 语法检查工具这里有列表http://t.cn/RheHWdP 推荐试试Link Grammar http://t.cn/h47cEM 它可检查是不是合乎语法.如果需要自定义的规则,可以把它的结果再过滤一下 [ [微博](http://www.weibo.com/5220650532/BqstnpYCx) ]
+
+2014-10-07 按年绘制了各政权的领土变迁,可以弥补谭其骧版的《中国历史地图集》一个朝代只有一个时间点,不能反映变迁的不足.五千年的历程浓缩为72分钟的视频 http://t.cn/RheVuga (刚才发的链接错了) [ [微博](http://www.weibo.com/5220650532/BqrsA0Hel) ]
+
+> 2014-10-01 @推遍天下: #推遍阅读#中国历史地图详细版version2.0。作者布哈林,是A站的一位up主。他把每个朝代精确成一个个大事件,将各个时间点做成地图,标注十分细致,中国和外国的考证都很充分。同时配上了如章回体目录一样的对联,非常带感。简直是历史地图控的最爱。http://t.cn/8kmDxfN @贫铀穿甲普拉斯 [ [微博](http://www.weibo.com/3047892900/Bpwc0nphV) ]
+
+2014-10-07 @IT莲接 推荐的<史上最全的的气象科研数据来源> http://t.cn/Rhgppds 来自@数据堂 , 列举了综合资料库,天气情况,降水资料,全球土壤资料,风场资料,海洋风场,海浪,海表温度,冰芯,台风等50多个数据集 部分数据集我们做了更直观的卡片预览 http://t.cn/RheCw1Z [ [微博](http://www.weibo.com/5220650532/BqrkwDlyl) ]
+
+2014-10-07 按年绘制了各政权的领土变迁,可以弥补谭其骧版的《中国历史地图集》一个朝代只有一个时间点,不能反映变迁的不足 五千年的历程浓缩为72分钟的视频 http://t.cn/Rhe9xeN [ [微博](http://www.weibo.com/5220650532/BqrfKi28G) ]
+
+> 2014-10-01 @推遍天下: #推遍阅读#中国历史地图详细版version2.0。作者布哈林,是A站的一位up主。他把每个朝代精确成一个个大事件,将各个时间点做成地图,标注十分细致,中国和外国的考证都很充分。同时配上了如章回体目录一样的对联,非常带感。简直是历史地图控的最爱。http://t.cn/8kmDxfN @贫铀穿甲普拉斯 [ [微博](http://www.weibo.com/3047892900/Bpwc0nphV) ]
+
+2014-10-07 来自最好的学术网络搜索ArnetMiner @唐杰THU [ [微博](http://www.weibo.com/5220650532/Bqpfao9aS) ]
+
+> 2014-10-07 @蔡学镛: 过去十八年,计算机科学领域,最好的论文,以及最常被引用的论文,通通在这里 [good]: http://t.cn/zYPysop [ [微博](http://www.weibo.com/1614282004/BqmV793yy) ]
+
+2014-10-07 关注 //@郑思遥:Arrikis 这篇的作者在这条路上已经走了好多年了,最早从08年开始就有文章要革操作系统的命,09年在sosp上发布barrelfish多内核操作系统。这帮人一直在做工作去支撑当时的多内核设计,这篇也是在barrelfish基础上做的,更完善更实际了,很值得学习 //@网路冷眼:转发微博 [ [微博](http://www.weibo.com/5220650532/Bqnoo5T2v) ]
+
+> 2014-10-06 @BigData大数据: #OSDI2014#第一时间快报。OSDI金球奖 最佳三篇论文出来了 这次热门GraphX落选 爆出大冷门 两篇来自底层OS 底层要革命了!还有一篇来自微软@微软亚洲研究院 Cloud 调度 Maven @chengangcs @龙星镖局 @李元超Osiris @好东西传送门 @chengangcs [ [微博](http://www.weibo.com/2870219257/BqlWWhOWi) ]
+
+
+----
+
+2014-10-06 会议主页 http://t.cn/RhItLb6 不熟悉这个会的 见@李沐M 前几天的科普http://t.cn/Rhg6IL3 欢迎大家来科普这届的潜在亮点和看点 @hashjoin @包云岗 [ [微博](http://www.weibo.com/5220650532/BqhZghUyp) ]
+
+> 2014-10-06 @BigData大数据: #OSDI2014#起飞了 期望能赶上晚上盛大的欢迎晚宴 OSDI是系统领域的风向标 无数老的大数据技术都是通过这个舞台介绍给全世界 比如MapReduce Spanner等 对于新的重要大数据技术 比如GraphX 微软的Adam 还有GPUNet都会在明天后天推荐给全学界业界 让我们一起期待 @好东西传送门 http://t.cn/z810m9f [ [微博](http://www.weibo.com/2870219257/Bqfv6itz6) ]
+
+2014-10-06 感谢作者 Liqizhou http://t.cn/zjf6Z67 同时推荐作者的另一篇文章 机器学习概要 http://t.cn/Rhgib8l,列举了各种方法的提纲 [ [微博](http://www.weibo.com/5220650532/BqhSagq7l) ]
+
+> 2014-10-06 @格灵深瞳: AdaBoost 算法的主要思想之一就是在训练集上维护一套权重分布,初始化时 ,Adaboost 为训练集的每个训练例指定相同的权重 1/m。接着调用弱学习算法进行迭代学习。每次迭代后更新训练集上不同样本的权值,对训练失败的样本赋以较大的权重。【AdaBoosting和online Boosting】http://t.cn/RhgIlYM [ [微博](http://www.weibo.com/3769368692/BqhuG3vea) ]
+
+2014-10-06 城市规划,社交媒体分析与自然语言处理的交叉研究 [ [微博](http://www.weibo.com/5220650532/BqgByoL6a) ]
+
+> 2014-10-05 @宋彦-规划: 分享下我的高富帅博士生@waholulu-陈炎 的高大上研究。话说他刚抓取了几天的Chicago的40万个twitter点如图。接下来开始分析阶段了,例如可以看看城市活动的热点,还可以用text sentiment analysis分析twitter的态度(积极/消极)和感情(愤怒惊喜啥的)并与城市场所对接,大家有什么好主意我们来实现! [ [微博](http://www.weibo.com/2610584165/Bqa80jeNa) ]
+
+2014-10-05 强烈推荐!Github上完整目录: http://t.cn/RP75CfG 现在已经完成语言的基本介绍,在写第三部分网站构建 [ [微博](http://www.weibo.com/5220650532/Bq8zd9tP1) ]
+
+> 2014-10-04 @老齐Py: @Jayin_Ton 推荐到我的网站上看完整的《零基础学python》,目前正在写tornado做网站部分。地址:http://t.cn/Rh6wm17 [ [微博](http://www.weibo.com/1449482283/Bq2g5k3rr) ]
+
+2014-10-05 感谢刘知远老师! //@刘知远THU: 整理得很好啊,分享!研究生的时候曾在水木上整理了一些资源,转眼几年NLP已经关版被微博取代了。技术大势,浩浩汤汤,不进则退,大家努力。:) [ [微博](http://www.weibo.com/5220650532/Bq7zgEVgv) ]
+
+> 2014-10-04 @好东西传送门: 《NLP常用信息资源》原资源主要是水木上的zibuyu整理的,@算文解字 推荐。这里我们综合了一些新的内容整理了一个初步的列表,包含了一些网站、课程、研究小组、重要学者、工具等。文字版 http://t.cn/RhrZUWq 部分资源的卡片预览 http://t.cn/RhrZUWG [ [微博](http://www.weibo.com/5220650532/BpZ5eBCdx) ]
+
+
+2014-10-05 很不错的文章。再补充一个技巧:用书名的isbn来搜往往会有惊喜 [ [微博](http://www.weibo.com/5220650532/Bq728oZ5G) ]
+
+> 2014-10-04 @武汉大学: 【我是怎么找电子书的】目前主页君所见最为齐全的搜索电子书的方法和软件汇总——中文、外文、学术资源、古典文籍,甚至竖版图书!直接网页格式,方便复制链接。别问我挖掘技术谁最强,各有所长,试过就知道[偷笑]http://t.cn/RhBT4av [ [微博](http://www.weibo.com/1666177401/BpXEI9Aon) ]
+
+2014-10-05 昨天推荐的文章《线性回归,偏差、方差权衡》,很抱歉没有及时发现原作者@LeftNotEasy 出处是http://t.cn/hrvcPf 他的博客里还有很多经典文章:机器学习中的数学系列:回归、梯度下降、线性回归、模型组合、LDA、PCA、SVD; 机器学习中的算法系列: 决策树 - 随机森林与GBDT(我们以前推荐过) SVM基础 [ [微博](http://www.weibo.com/5220650532/Bq6GNbQUF) ]
+
+2014-10-05 //@算文解字:赞!最应该感谢的是 @刘知远THU 哈,不解释 :) 另外书里边,很多NLPer还很推崇宗成庆老师的《统计自然语言处理》,已经出第2版了,内容很新。 [ [微博](http://www.weibo.com/5220650532/Bq3LcDWuu) ]
+
+> 2014-10-04 @好东西传送门: 《NLP常用信息资源》原资源主要是水木上的zibuyu整理的,@算文解字 推荐。这里我们综合了一些新的内容整理了一个初步的列表,包含了一些网站、课程、研究小组、重要学者、工具等。文字版 http://t.cn/RhrZUWq 部分资源的卡片预览 http://t.cn/RhrZUWG [ [微博](http://www.weibo.com/5220650532/BpZ5eBCdx) ]
+
+
+----
+
+
+2014-10-04 《NLP常用信息资源》原资源主要是水木上的zibuyu整理的,@算文解字 推荐。这里我们综合了一些新的内容整理了一个初步的列表,包含了一些网站、课程、研究小组、重要学者、工具等。文字版 http://t.cn/RhrZUWq 部分资源的卡片预览 http://t.cn/RhrZUWG [ [微博](http://www.weibo.com/5220650532/BpZ5eBCdx) ]
+
+2014-10-04 //@十月伤感wb: 【进段广告】我们今年SIGIR文章 Your Neighbors Affect Your Ratings 算是推荐系统里的特征工程,利用商家跟邻近商家的相互影响来提高rating prediction效果。主页 http://t.cn/RhBSY0S ACM http://t.cn/RhBSY0a [ [微博](http://www.weibo.com/5220650532/BpYUb4HJ0) ]
+
+> 2014-10-03 @AixinSG: 如何选择最适合的推荐模型 Choosing a Recommender Model 转自 GraphLab Blog http://t.cn/RhWlFCg [ [微博](http://www.weibo.com/1025887594/BpRAnsYWV) ]
+
+2014-10-04 在加长版里还有个“触类旁通”栏目,列举了有趣的其他话题。比如@GK同人于野 发起的机器人书写的图灵测试的话题 http://t.cn/RhBmK6x 提到机器故意犯错误伪装自己是人的例子 http://t.cn/Rh1eJ0z (Youtube) [哈哈] [ [微博](http://www.weibo.com/5220650532/BpXbccKMv) ]
+
+> 2014-10-04 @好东西传送门: 机器学习头条2014-10-03 http://t.cn/RhBRuRz 1) 选择最适合的推荐模型 @AixinSG 2) 线性回归,偏差、方差权衡 @AustinCody 3) 决策树模型组合之随机森林与GBDT @格灵深瞳 4) 谷歌的线性规划工具glop和运筹学工具集or-tools @王威廉 5) 神经网络黑客指南 @安人心智 加长版21条 http://t.cn/RhBRuRZ [ [微博](http://www.weibo.com/5220650532/BpWJlA8lf) ]
+
+2014-10-04 原文有不错的Python讲解 //@AixinSG: 讲根据数据的特性选择最适合的模型。再往后退一步,从最原始数据得到针对具体推荐问题的最佳表述就有点特征工程的意思了。几年前有个比赛,我同事是评审,说收到的报告有3种:1. 做实验,解释结果 2. 分析数据,选择模型,解释结果 3. 分析数据,实验,然后解释 [ [微博](http://www.weibo.com/5220650532/BpWK0m6sJ) ]
+
+> 2014-10-03 @AixinSG: 如何选择最适合的推荐模型 Choosing a Recommender Model 转自 GraphLab Blog http://t.cn/RhWlFCg [ [微博](http://www.weibo.com/1025887594/BpRAnsYWV) ]
+
+2014-10-04 机器学习头条2014-10-03 http://t.cn/RhBRuRz 1) 选择最适合的推荐模型 @AixinSG 2) 线性回归,偏差、方差权衡 @AustinCody 3) 决策树模型组合之随机森林与GBDT @格灵深瞳 4) 谷歌的线性规划工具glop和运筹学工具集or-tools @王威廉 5) 神经网络黑客指南 @安人心智 加长版21条 http://t.cn/RhBRuRZ [ [微博](http://www.weibo.com/5220650532/BpWJlA8lf) ]
+
+2014-10-04 一篇不错的介绍线性回归的文章 [ [微博](http://www.weibo.com/5220650532/BpWrOtXYa) ]
+
+> 2014-10-03 @AustinCody: 真正的线性回归,不仅会考虑使得曲线与给定点集的拟合程度最好,还会考虑模型最简单,这个话题我们将在本章后面的偏差、方差的权衡中深入的说。概率分布是一个可爱又可恨的东西,当我们能够准确的预知某些数据的分布时。。。。。。 http://t.cn/RhBy6ym [ [微博](http://www.weibo.com/5106435191/BpRuqaTPz) ]
+
+----
+
+2014-10-03 经典文章 Greedy function approximation : A Gradient Boosting Machine http://t.cn/Rh1dW44 并行实现推荐 @陈天奇怪 的xgboost,实际例子见@phunter_lau 最近的文章 http://t.cn/RhKAWac 更多GBDT http://t.cn/Rh1dW4y [ [微博](http://www.weibo.com/5220650532/BpPEBdnO4) ]
+
+> 2014-10-03 @格灵深瞳: 模型组合与决策树相关的算法比较多,这些算法最终的结果是生成N棵树,这样可以大大的减少单决策树带来的毛病,有点类似于三个臭皮匠等于一个诸葛亮的做法,虽然这几百棵决策树中的每一棵都很简单,但是他们组合起来确是很强大。【决策树模型组合之随机森林与GBDT】http://t.cn/Rh1uZ1Y [ [微博](http://www.weibo.com/3769368692/BpP51Bkvo) ]
+
+2014-10-03 Hacker's guide to Neural Networks 教程是用Javascript写的神经网络. 同一作者以前写的convnetjs http://t.cn/Rh1dfKB [ [微博](http://www.weibo.com/5220650532/BpPCL7EB5) ]
+
+> 2014-10-03 @安人心智: #脑技术# 【神经网络黑客指南】现在,最火莫过于深度学习(Deep Learning),怎样更好学习它?可以让你在浏览器中,跑起深度学习效果的超酷开源项目convnetjs作者karpathy告诉你,最佳技巧是,当你开始写代码,一切将变得清晰。他刚发布了一本图书,不断在线更新:http://t.cn/RhSJkOz [ [微博](http://www.weibo.com/2710875561/BpNDGlONo) ]
+
+2014-10-03 补充一个线性规划的Python包 PuLP http://t.cn/Rh1d4hV 是GLPK的一个外壳。 非常简单好用 [ [微博](http://www.weibo.com/5220650532/BpPBLFRx6) ]
+
+> 2014-10-03 @王威廉: 线性规划是在优化、机器学习以及自然语言处理中经常遇到的重要问题。谷歌近日开源了他们的线性规划工具glop。另外,谷歌的开源运筹学工具集or-tools中还包括有各种约束优化问题,线性优化问题,背包问题以及图算法的工具。Google Code下载: http://t.cn/Rh1Wwze [ [微博](http://www.weibo.com/1657470871/BpNM0fzQG) ]
+
+2014-10-03 和@DonaldErvinKnuth 这条参照着看 [呵呵] http://t.cn/Rh1rdx8 还有@李沐M 的这条 http://t.cn/Rh1rdxQ [ [微博](http://www.weibo.com/5220650532/BpPzP7Lns) ]
+
+> 2014-10-03 @晨曦Stephen: Hinton祖师爷来talk, 讲他被nips rejected的paper~问他如何评价最近imagenet challenge的趋势,他说going deeper just work, but that's boring and rubbish, computer vision不应该走这个方向..... [ [微博](http://www.weibo.com/2097352953/BpMXNxxgK) ]
+
+2014-10-03 nolearn十分的Pythonic, 非常简单,和scikit-learn一样好用。项目文档http://t.cn/Rh1rpyM 目前实现了convnet和dbn [ [微博](http://www.weibo.com/5220650532/BpPxHCtSM) ]
+
+> 2014-10-03 @xccds: 两个很好的deep leaning实例示范,用python的nolearn包来实施http://t.cn/Rh11bsl 用R的H2O包来做 http://t.cn/Rh0RNZS [ [微博](http://www.weibo.com/1400524015/BpPirqnf4) ]
+
+2014-10-03 //@张俊林say: 我个人还是首推《统计自然语言处理》,尽管从内容角度讲有点旧因为毕竟出版了10年了,但是可以很好地培养成利用统计思路解决NLP实际问题的思维框架,这一点其它教材都比不上这本。//@好东西传送门: 推荐吴俣的这篇文章. Stanford那门NLP公开课 http://t.cn/zTagx9z [ [微博](http://www.weibo.com/5220650532/BpPu9brIo) ]
+
+> 2014-09-21 @gerrylin: 自然语言处理怎么最快入门? #读知乎# http://t.cn/RhN1Qhi [ [微博](http://www.weibo.com/1424552461/Bo3dtAHyS) ]
+
+2014-10-03 机器学习头条 2014-10-02 http://t.cn/Rh1WlIL 1)自然语言处理怎么最快入门 by吴俣 @gerrylin 2) 公开课 “矩阵与线性方程组” by马辉 @清华MOOCs 3) String Re-writing Kernel @李航博士 4) Google用深度学习做反垃圾 @我爱机器学习 5)免费电子书Math for CS @velvel2 加长版 http://t.cn/Rh1WlIy [ [微博](http://www.weibo.com/5220650532/BpNQFxwHJ) ]
+
+2014-10-03 //@赶路人林文: Coursera上面有两门NLP的课程,个人比较喜欢哥伦比亚大学的Michael Collins。随课程有相关的阅读材料。NLP with python 只要懂一点python就基本没问题,英文版最佳,入门必备。//@好东西传送门: 推荐吴俣的这篇文章. Stanford那门NLP公开课 http://t.cn/zTagx9z [ [微博](http://www.weibo.com/5220650532/BpMhEdL6y) ]
+
+> 2014-09-21 @gerrylin: 自然语言处理怎么最快入门? #读知乎# http://t.cn/RhN1Qhi [ [微博](http://www.weibo.com/1424552461/Bo3dtAHyS) ]
+
+----
+
+2014-10-02 推荐吴俣的这篇文章. Stanford那门NLP公开课 http://t.cn/zTagx9z 同推荐, 讲得非常好, 适合入门 Python的包列了pattern scikit-learn 小门再补充NLTK gensim和textblob [ [微博](http://www.weibo.com/5220650532/BpGQm0Cu0) ]
+
+> 2014-09-21 @gerrylin: 自然语言处理怎么最快入门? #读知乎# http://t.cn/RhN1Qhi [ [微博](http://www.weibo.com/1424552461/Bo3dtAHyS) ]
+
+2014-10-02 @传媒老跟班 最近整理了一个<论文检测> http://t.cn/Rh3nerp 列举了9个中英文系统 PaperPass Copycheck 维普通达 万方数据 Viper 中国搜 Turnitin Dustball PPVS 值得参考 [ [微博](http://www.weibo.com/5220650532/BpGKxukMy) ]
+
+> 2014-08-20 @好东西传送门: 问: @sxhfut 能否推荐一下英文论文的学术不端检测系统或网站,免费的或者收费的靠谱的 答: 关键词Plagiarism, 初步答案与进展: http://t.cn/RPn5uwR Turnitin收费,有很多学校用户; Viper 有免费windows单机版; Plagium 免费在线不限长度, 上了两个排行榜,可以同时用几个交叉检测。欢迎补充指正。 [ [微博](http://www.weibo.com/5220650532/Bjdaxhu6s) ]
+
+2014-10-02 Finlay-Liu @ Github 推荐了冈萨雷斯的<数字图像处理>, 其中第4章频域处理,第5章图像复原都与图像增强相关 http://t.cn/Rh3nUXI [ [微博](http://www.weibo.com/5220650532/BpGFWm6CQ) ]
+
+> 2014-10-01 @好东西传送门: @小白_小可乐 问:有没有图像增强方面的学习资料啊? 答:图像增强主要分为空域方法和频域方法两大类.这里收集了几篇综述文章 http://t.cn/Rhua1eo 讨论页 http://t.cn/RPlPCU5 欢迎CV领域的专家增补 [ [微博](http://www.weibo.com/5220650532/BpwA4yquC) ]
+
+2014-10-02 强烈推荐!另外再推一次李航博士的新书《Semantic Matching in Search》阐述了搜索中语义匹配的基本方法. 预览与目录 http://t.cn/RPiq2hc [ [微博](http://www.weibo.com/5220650532/BpFDZ9jIP) ]
+
+> 2014-10-02 @李航博士: 最近在台湾做报告时讲 Semantic Matching,回来后把其中介绍 String Re-writing Kernel的部分整理成了短文。http://t.cn/Rh3Kt0z 这个工作曾获得ACL 2012 Best Student Paper Award。与@布凡THU @朱小燕THU 合作的工作。 [ [微博](http://www.weibo.com/2060750830/BpEVUFTGH) ]
+
+2014-10-02 机器学习头条2014-10-01 http://t.cn/Rh36jCa 1)ACM COSN社交网络会议文章下载 @AixinSG 2) 特征工程的方方面面 @xccds 3) semdom英语常用词和词组语义归类 @莫水田 4) Spark MLlib分布式决策树性能提升了2-5倍 @hashjoin 5) Chris Adolph的最大似然课程 @romanxu 加长版23条 http://t.cn/Rh36jCX [ [微博](http://www.weibo.com/5220650532/BpEpmtBzf) ]
+
+----
+
+2014-10-01 不错。没列什么公式,但很有insights//@Copper_PKU:转发微博 [ [微博](http://www.weibo.com/5220650532/BpyQKk4lh) ]
+
+> 2014-10-01 @xccds: http://t.cn/RhumtBN 这篇综述了特征工程的方方面面,值得一读。 [ [微博](http://www.weibo.com/1400524015/BpyMkpCvZ) ]
+
+2014-10-01 semdom,一个很不错的分类树,也可以算本体ontology或者常识知识库,含1800语义类.很友好的Creative Commons授权证 [ [微博](http://www.weibo.com/5220650532/BpxI5lUaR) ]
+
+> 2014-10-01 @莫水田: 我曾想按照语义来给英语常用词和词组归类,不过缺乏能力和行动力,昨晚上发现原来有人已经做了 http://t.cn/RhuOrs3,这个“语义” 网上各种词类都有,较神奇。 多写描绘叙事短文,写时参阅语义网、Oxford Pictorial English Dictionary 和Dictionary of Phrasal Verbs, 那写出生动的英语几年可待~ [ [微博](http://www.weibo.com/1940113775/BpxwV2F4B) ]
+
+2014-10-01 赞MLlib http://t.cn/Rhuofir 补充一个PPT MLlib Decision Trees at SF Scala-BAML Meetup http://t.cn/Rhuofid [ [微博](http://www.weibo.com/5220650532/BpwK2shmJ) ]
+
+> 2014-10-01 @hashjoin: 决策树是数据挖掘中常用的一个算法。在社区和Databricks的合作下,Spark MLlib 1.1对分布式决策树进行了大量的优化,最新版本比上一个版本性能提升了2 - 5倍。这篇博客介绍了几个重要的优化和具体的性能提升 http://t.cn/RhuSxCX [ [微博](http://www.weibo.com/1630850750/BpwDEuAWI) ]
+
+2014-10-01 运维必须知道的15个项目:docker轻量级容器 vagrant部署应用 statsd统计汇总 ansible自动化部署 capistrano远程自动化 salt基础组件通信 sentry处理错误日志 fabric远程调用 chef配置管理 logstash日志处理 peppet服务器自动化 essay 项目部署 等,他们的Github信息一览:http://t.cn/RhuSEzM [ [微博](http://www.weibo.com/5220650532/BpwGe4OJP) ]
+
+2014-10-01 @小白_小可乐 问:有没有图像增强方面的学习资料啊? 答:图像增强主要分为空域方法和频域方法两大类.这里收集了几篇综述文章 http://t.cn/Rhua1eo 讨论页 http://t.cn/RPlPCU5 欢迎CV领域的专家增补 [ [微博](http://www.weibo.com/5220650532/BpwA4yquC) ]
+
+2014-10-01 //@Noodles-Xu:/@road2stat:各位HR看过来![太开心]//@统计之都: 作者是统计之都主站编辑之一高涛@三水成海 ,目前研三正在找工作中,欢迎勾搭//@xebro:博主另外几篇很不错的总结:PKU暑期高维统计学习心得 http://t.cn/RhmR6OA ,以及作者收集的当时PKU暑期讲座的相当全的材料 http://t.cn/RhmR6Ow [ [微博](http://www.weibo.com/5220650532/BpvrH2Mbb) ]
+
+> 2014-09-30 @张磊-机器学习: 一篇对ADMM原理及并行化方法总结的很棒的文章,大家耐着性子看完吧:http://t.cn/RPoPFOm [ [微博](http://www.weibo.com/1822639887/Bpn1t6FGN) ]
+
+2014-10-01 文名 <从HTML Components的衰落看Web Components的危机>下面有好多大牛在参与讨论,大家快去[围观] [ [微博](http://www.weibo.com/5220650532/Bpvacimsu) ]
+
+> 2014-10-01 @民工精髓V: 看到大家对Angular,React和Polymer的讨论,我写了一些对Web Components的看法,欢迎大家探讨:http://t.cn/RhmdVXZ [ [微博](http://www.weibo.com/1858846672/BprVLmDJs) ]
+
+2014-10-01 机器学习头条2014-09-30 http://t.cn/RhubqP6 1)天猫推荐算法大赛Top 9团队访谈 @万物皆三NLP 2) Radim Řehůřek: Multicore LDA in Python @星空下的巫师 3)正文抽取的开源代码 @KissDev 4) 量子机器学习 @尹璋琦THU 5) 通过机器学习算法找到真爱 @王威廉 加长版32条 http://t.cn/RhubqPX [ [微博](http://www.weibo.com/5220650532/BpuZGa9Is) ]
+
+2014-10-01 @romanxu 刚才推荐了华盛顿大学统计课Chris Adolph教授的课程Maximum Likelihood Methods for the Social Sciences 为方便浏览,把他的课件都做了预览卡片这这里 http://t.cn/Rhu4DdQ 这门课比较理论联系实际,适合非统计或计算机专业来学. [ [微博](http://www.weibo.com/5220650532/BpuXs9hy3) ]
+
+2014-10-01 转发理由:涵盖各种模型,如二进制数据,有序数据,称名数据(有名字但无顺序),可数数据,缺失数据,等,都可由最大似然方法处理 [ [微博](http://www.weibo.com/5220650532/BpuUahYSR) ]
+
+> 2014-10-01 @romanxu: 隆重推荐:统计课maximum likelihood的教授Chris Adolph,哈佛血统,年轻有为。完全的共享派:编程用R,不用STATA;文字处理用LaTex不用Office;课件完全公开http://t.cn/RP1QErM。还不遗余力给学生写了牛文:Social Science Computing for the Mac in 15 Steps and $29 (http://t.cn/RhuPgl2 [ [微博](http://www.weibo.com/1651598281/BptaEgzO8) ]
+
+2014-10-01 对前几天推荐过的概率分布关系图的详细解释来了[good] //@许扬逸Dijkstra [ [微博](http://www.weibo.com/5220650532/Bpslq2GEk) ]
+
+> 2014-09-28 @上微博的猫V: 【一张图的故事——概率分布之间的关系(上)】 概率分布之间的关系是个有趣的话题。若要一张图简要概述概率分布之间的关系,下图是经典。本文将从上到下,从左到右解释这张图。本来要全部写完才发布的。不过考虑到明天就回家了,家里没有网肯定写不了,所以先发布… http://t.cn/RhEZ2HJ [ [微博](http://www.weibo.com/1679022231/Bp8OT644W) ]
+
+----
+
+2014-09-30 @杜威Dewey 问:互联网应用的分布式数据库存储使用网络存储有什么好方案吗 答:讨论总结现在在issue 62 http://t.cn/RhmtmqT Nexenta、OpenFiler这些开源软件能否上生产环境有几篇近几年的文章. tildelingu老师给了更精华的总结.见长微博 [ [微博](http://www.weibo.com/5220650532/BpoikzVBI) ]
+
+2014-09-30 推荐.加入我们Python资源区的正文提取专题.那里还列举了十多种其他工具 http://t.cn/Rhm2qhw [ [微博](http://www.weibo.com/5220650532/BpnqyjwL1) ]
+
+> 2014-09-30 @KissDev: 正文抽取的开源代码,基于文本密度的html2article: http://t.cn/8FvHNOY 基于标签比例的机器学习Dragnet: http://t.cn/RhnDNg0 专注新闻类网页提取的Newspaper: http://t.cn/RhnDNgW 集成goose等三种算法的readbilitybundle http://t.cn/RhnDNgO 我觉得最好的方法还可能是视觉系方法 [ [微博](http://www.weibo.com/1699016425/BpmqDx5GK) ]
+
+
+2014-09-30 机器学习头条2014-09-29 http://t.cn/RhnECPX 1 机器学习视频课程 @雅虎北京全球研发中心 2 麻省理工Gilbert Strang的《线性代数》课程 @王威廉 3 大数据处理资源、工具 @bitslife 4 R语言抓取实时股票数据的API (作者 @Jincheng9 ) 5 推荐书《语言本能》@西瓜大丸子汤 加长版http://t.cn/RhnECPS [ [微博](http://www.weibo.com/5220650532/BpljlEKUi) ]
+
+2014-09-30 跨平台的优秀编辑器。非常好的中文介绍 [ [微博](http://www.weibo.com/5220650532/BpkCaxyG9) ]
+
+> 2014-09-28 @慕课网: #IT技术分享#【Sublime Text 全程指引】本文系统全面的介绍了Sublime Text,旨在成为最优秀的Sublime Text中文教程,分享给大家。绝对干货,一般人我不告诉。[推荐]原文地址:http://t.cn/Rh8uSA2 [ [微博](http://www.weibo.com/3306361973/Bp4YIuj6T) ]
+
+2014-09-30 转发理由:awesome-bigdata 600多个数据存储、分析相关项目。Github 地址: http://t.cn/RhE6VaJ 作者Onur Akpolat [ [微博](http://www.weibo.com/5220650532/BpjUBs0Av) ]
+
+> 2014-09-29 @bitslife: 大数据数据处理资源、工具不完备列表, 从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等。很赞的资源汇总。 http://t.cn/8FwSiyK [ [微博](http://www.weibo.com/1895047203/Bpcpu3os6) ]
+
+----
+
+2014-09-29 讨论242 不完全整理贴 http://t.cn/RhE8U44 补充了一篇论文 When Stopword Lists Make the Difference 一个很好玩的发现,英文里9个词的stopword list 与500多词的单子效果差异不大,法语类似。至于中文 ...还希望专家多讲讲 [ [微博](http://www.weibo.com/5220650532/Bpe3p9Ien) ]
+
+> 2014-09-28 @AixinSG: 相对于常规网页或新闻,我觉得停用词在用户生成内容里面会更重要一些,现在更倾向于在索引中保留每个词。Stop stopping stop words: a look at Common Terms Query http://t.cn/Rh8DFRh [ [微博](http://www.weibo.com/1025887594/Bp2RkCBrH) ]
+
+2014-09-29 Python的可穿透防火墙的轻量代理 主页 http://t.cn/Rvc8VZG 使用说明 http://t.cn/zQZIZMd //@Easy: 和Goagent比起来,除了可以自建服务器更稳定外,SS是全局代理,所以Dropbox等客户端也可以用了 [ [微博](http://www.weibo.com/5220650532/BpdRZ9EmC) ]
+
+> 2014-09-29 @Easy: 最近换用Shadowsocks科学上网,非常爽,推荐一把。Mac有客户端,全局代理,自动绕过国内网站,还能手工加名单。谷歌Play市场有应用可用。如果不爱用公用服务器,可以自己搭,一条命令:「 pip install shadowsocks 」顺便放个DO的10美刀优惠 http://t.cn/RP1OvQK [ [微博](http://www.weibo.com/1088413295/BpdNG20WK) ]
+
+2014-09-29 问: 大数据安全或隐私的现状综述? 答: 资料整理 http://t.cn/RhETCi9 推荐一篇2014年综述 Security Issues in Cloud Environments, A Survey 很新很全面: 对比此前10篇相关综述, 覆盖工业界话题, 引用315篇论文。粗分8大类: 软件, 存储与计算, 虚拟化, 互联网与服务, 网络, 访问控制, 信任, 法律 [ [微博](http://www.weibo.com/5220650532/BpdPema1O) ]
+
+2014-09-29 mysql数据库进化图 [ [微博](http://www.weibo.com/5220650532/BpdBgBVtY) ]
+
+> 2014-09-29 @MySQL_DBA: 分享图片 [ [微博](http://www.weibo.com/1979536592/Bpdwwyb0k) ]
+
+2014-09-29 推荐一个基于R语言的API (作者 @Jincheng9 ) 从新浪财经上抓取实时股票和指数数据,包括前收盘价,开盘价,当前价格,今日最高价,今日最低价,成交额等 http://t.cn/RhRahT6 [ [微博](http://www.weibo.com/5220650532/BpbVHeNjs) ]
+
+----
+
+2014-09-28 求指点//@Nick蓝色风暴:接着上一话题,对于随机游走,比如是基于Uniform分布的游走,就是在[current-x1,current+x2]这个区间均匀随机一个数(x1和x2是常量)。而当x1=x2时,是对称随机游走,也就是M算法;当x1不等于x2时,是不对称游走,也就是MH算法。请问我的理解对吗?请大牛们指教@研究者July [ [微博](http://www.weibo.com/5220650532/Bp61jjF8f) ]
+
+> 2014-09-28 @Nick蓝色风暴: 最近学习MCMC的经典MH算法,被几个不同版本的代码实现给搞糊涂了,关键步骤在于如何得到下一个状态,好像大概分为Independent MCMC和Random Walk MCMC这两种。我现在的理解:独立MCMC是给定一个固定分布,要得到下一个状态就从这个分布里随机一个数;随机游走就是根据当前状态值来随机得到下一个状态。 [ [微博](http://www.weibo.com/1096796232/Bp5OoccYv) ]
+
+2014-09-28 这个讨论很有意义,明天小门会帮着整理合集,请各位专家继续 //@章成志: 是的,要看具体场合,实际上,“停用词”这个概念来源于信息检索、文本分类这样的任务,通常那些区分性较低(idf低)的词很多就是停用词,如果做情感分类等任务,有些词不但不能停用反而很重要。 [ [微博](http://www.weibo.com/5220650532/Bp5joiZta) ]
+
+> 2014-09-28 @AixinSG: 相对于常规网页或新闻,我觉得停用词在用户生成内容里面会更重要一些,现在更倾向于在索引中保留每个词。Stop stopping stop words: a look at Common Terms Query http://t.cn/Rh8DFRh [ [微博](http://www.weibo.com/1025887594/Bp2RkCBrH) ]
+
+2014-09-28 传送理由:Rob Fergus的用深度学习做计算机是觉的NIPS 2013教程。有mp4, mp3, pdf各种下载 pdf传送门 http://t.cn/RhRXlO1 他是纽约大学教授,目前也在Facebook工作,他2014年的8篇论文 http://t.cn/RhRXlO3 [ [微博](http://www.weibo.com/5220650532/Bp5f4inDt) ]
+
+> 2014-09-28 @老淘: Tutorials Session A - Deep Learning for Computer Vision - Microsoft Research http://t.cn/RhR7Jhg [ [微博](http://www.weibo.com/1849537887/Bp3lUetVx) ]
+
+2014-09-28 传送门的小伙伴们应该会喜欢这本书,非常有趣的视角,非常重要的话题。 [ [微博](http://www.weibo.com/5220650532/Bp543bsWU) ]
+
+> 2014-09-28 @GK同人于野: 我的书《万万没想到:用理工科思维理解世界》出版了,现已开始在京东预售 http://t.cn/RhRxvhy 此书按三个主题 - 反常识思维、成功学的解药、霍金的答案 - 精选并完善了我的文章,其中重点篇目做了很大程度的补充和改写,加入不少新内容,使其达到2014年最新知识。赵南元老师(@荒川围脖 )慷慨作序! [ [微博](http://www.weibo.com/2089800791/Bp4YdqYKG) ]
+
+2014-09-28 //@海中的沙粒:回复@ComplexLY:我有一本R数据可视化手册的书,就是教你如何用ggplot2来做数据可视化,说实话跟Tableau做的图,没法比,很多感觉需要用adobe illustrator 来修正下才拿的出手,嘿嘿,真的有点渣 //@ComplexLY:ggplot2 //@海中的沙粒:竟然忘记Python这个跟R差不多的软件了,这个更强悍 [ [微博](http://www.weibo.com/5220650532/Bp2L3dxFO) ]
+
+> 2014-09-28 @海中的沙粒: STATA ,SPSS的学术性意义比较强,STATA的几类回归分析上是最经典的,SPSS在方差分析上非常厉害,SAS适合数据库数据量更大等量级的分析,R比较综合性,编程性上属于难度中等,matlab更倾向于学计算机语言的,编程性更强,数据分析性机器计算更多,总得来说,R是最关键的,因为综合性 [ [微博](http://www.weibo.com/1843007450/Bp1euBodP) ]
+
+----
+
+2014-09-27 R工具包的分类汇总 (CRAN Task Views, 34种常见任务,每个任务又各自分类列举若干常用相关工具包) http://t.cn/RhQy8o5 例如: 机器学习,自然语言处理,时间序列分析,空间信息分析,多重变量分析,计量经济学,心理统计学,社会学统计,化学计量学,环境科学,药物代谢动力学 等 [ [微博](http://www.weibo.com/5220650532/BoTv056xB) ]
+
+
+2014-09-27 问: 请问用于复杂网络分析R软件包? 答: 资料汇总 http://t.cn/RhQwuXT 推荐两个经典包 statnet, igraph 。 R社区有个很全的分类列表覆盖几十个包; 还有几个不错的在线入门课程与学习资料 例如 Stanford的“R for Social Network Analysis” [ [微博](http://www.weibo.com/5220650532/BoT592e2T) ]
+
+----
+
+2014-09-26 赞Search Formula-1 !//@张颖峰: 如果说常规搜索已经是个解决了的问题(比如elasticsearch等等),为什么还要重新造这个轮子,答案是,更好的可定制性以及更快速的性能。尽管代码质量有待提高,但做为经过高压环境验证的完整解决方案,必将给开发者以更充足的空间来按需补充和裁剪。Apache License [ [微博](http://www.weibo.com/5220650532/BoLJTjP1R) ]
+
+> 2014-09-26 @张颖峰: 也许现在有些早,但苦于没有更多的成员和时间来完善文档,所以还是赶在这个周末之前把我们之前一直完善的引擎对外宣布了,这就是C++编写的高性能分布式搜索存储一体化引擎,主要面向开发者。http://t.cn/RhT3I3B @好东西传送门 [ [微博](http://www.weibo.com/1788077877/BoLngj2V3) ]
+
+2014-09-26 回复@民工_李江: 非常感谢补充 课程链接 http://t.cn/zYsV43a //@民工_李江:Mattew Jackson在Coursera上有门相关的课: social and economic networks,好像这期刚开始不久 [ [微博](http://www.weibo.com/5220650532/BoKGBEX1J) ]
+
+> 2014-09-26 @好东西传送门: 问: 求经济学方向社会网络资料? 答: 文献汇总 http://t.cn/RhTlXMC 社会网络(social network)基础知识先看维基百科和在线教材"Introduction to social network methods". 四篇经济学方向文章, 推荐斯坦福教授Matthew Jackson (2010) "An Overview of Social Networks and Economic Applications" 96页 [ [微博](http://www.weibo.com/5220650532/BoKB6Eafx) ]
+
+
+2014-09-26 问:有没有最新的讲述人工智能发展史,现状,展望的资料? 答:人工智能(Artificial Intelligence) 领域综述有一个很好玩的图 "AI Landscape" (2008年AI Magazine附送的海报), 再配上一个AI历史大事件的时间轴demo “ Companion Timeline of Artificial Intelligence History” http://t.cn/RhTXnDF [ [微博](http://www.weibo.com/5220650532/BoJAcrUuy) ]
+
+2014-09-26 不错,这个应该是第二版 @Vamei 2013年的第一版还有些有趣的图片 http://t.cn/zYtMBGK //@西瓜大丸子汤: 推荐给@好东西传送门 //@Vamei:原作者来认领 [ [微博](http://www.weibo.com/5220650532/BoHdz858S) ]
+
+> 2014-09-25 @Linux中国: #Python 语言的发展简史# Python是我喜欢的语言,简洁,优美,容易使用。前两天,我很激昂的向朋友宣传Python的好处。 好吧,我承认Python不错,但它为什么叫Python呢? 呃,似乎是一个电视剧的名字。 那你说的Guido是美国人么? 他从Google换到Dropb…http://t.cn/RhYgiGm [ [微博](http://www.weibo.com/1772191555/BoG25tiMh) ]
+
+2014-09-25 这个scrum guide是个经典,对scrum困惑的同学可以看看。同时推荐好文 "The 2013 Scrum Guide changes" http://t.cn/RhjdQ1W 1. Artefact Transparency strengthened 2. Sprint Planning 3. Definition of Ready 4. Time boxes relaxed for most meetings 5. Daily Scrum purpose clarified [ [微博](http://www.weibo.com/5220650532/BoBCqkL9Z) ]
+
+> 2014-09-25 @朱少民: 当Scrum 的应用爆炸式增长时,形形色色的Scrum变种就出现了,不少公司已经忘记了Scrum 的价值和原则,为此,Scrum Alliance、scrum.org等联合发布了对Scrum的指导文件: http://t.cn/Rhjrrbs [ [微博](http://www.weibo.com/1652927771/BoByZyCjh) ]
+
+2014-09-25 问: 求计算神经科学资料? 答: 1. 资源门户网站(学者,论文,课程一网打尽) "Computational Neuroscience on the Web" http://t.cn/RhjQAgV 2. 暑期学校(2010至2014共5期) http://t.cn/RhjQAgc 3. 还有华盛顿大学公开课 "Computational Neuroscience" 谢 @苏梦Neuro-Gatsby @课程图谱 @要有光LTBL 推荐 [ [微博](http://www.weibo.com/5220650532/BoAQg5kj6) ]
+
+2014-09-25 [计算机视觉数据集不完全汇总] http://t.cn/Rhj0T9K 经典热点数据集: ImageNet,Flickr,MNIST 数据集目录: YACVID(200+),ComputerVisionOnline(100+),CVpapers(100+),CVOnline(100+),UIUC,UCSD,NICTA... 感谢 @丕子 @邹宇华 @李岩ICT人脸识别 @网路冷眼 @王威廉 @金连文 @数据堂 zhubenfulovepoem 推荐 [ [微博](http://www.weibo.com/5220650532/BoAbfmDPA) ]
+
+2014-09-24 搞数据挖掘的同仁怎么看? 气象学专业呢? //@复旦陈硕frank: 转发微博 [ [微博](http://www.weibo.com/5220650532/Bot0Cl2BQ) ]
+
+> 2014-09-24 @中国社会科学院金融评论: Journal of Economic Literature最新一期的文章http://t.cn/RhlbJno 对近年来采用高频面板数据研究天气(相对于以往低频数据刻画的“气候”)经济效应的文献进行了评述。作为这一领域的外行,感觉这篇有趣的综述除了有助于找各种IV之外,在某些具体事实和技巧上也很有启发。 [ [微博](http://www.weibo.com/3205772127/BosQWsyNb) ]
+
+2014-09-24 可以看看教学录像,这个课可为两种目标服务:第一、了解计算生物学中的挑战性问题,寻求更好的计算方法,应用前沿的机器学习方法(很好奇深度学习的应用)第二、理解可以使用计算方法,尤其是现成的机器学习工具,把它们应用到生物学、医学前沿问题中 Bioinformatics, Health informatics //@医学统计 [ [微博](http://www.weibo.com/5220650532/Bosjr9NpC) ]
+
+> 2014-09-24 @好东西传送门: 一张图表解析生物信息学中算法的实际应用(摘自"An Introduction to Bioinformatics Algorithms")同时推荐该书作者Pavel Pevzner (UCSD教授, ACM院士) Coursera公开课Bioinformatics Algorithms (今年10月开课) http://t.cn/RhWs4Cp YouTube教学视频 http://t.cn/RhWs4CO 需要较强的数学及算法基础 [ [微博](http://www.weibo.com/5220650532/BorSV49Fo) ]
+
+2014-09-24 一张图表解析生物信息学中算法的实际应用(摘自"An Introduction to Bioinformatics Algorithms")同时推荐该书作者Pavel Pevzner (UCSD教授, ACM院士) Coursera公开课Bioinformatics Algorithms (今年10月开课) http://t.cn/RhWs4Cp YouTube教学视频 http://t.cn/RhWs4CO 需要较强的数学及算法基础 [ [微博](http://www.weibo.com/5220650532/BorSV49Fo) ]
+
+2014-09-24 推荐 @tornadomeet 整理的 《本人常用资源整理(ing...)》 http://t.cn/zO1YaAE #深度学习#, #机器学习#,#数据挖掘#, #计算机视觉#,优化,数学,Linux,领域牛人,课程 ... ;-) 此人的博客可以归类为 #学霸的学习笔记# [ [微博](http://www.weibo.com/5220650532/BortzCrYs) ]
+
+2014-09-24 回复@尘绳聋-SYSU: 补上 @tornadomeet 原作 “机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)” http://t.cn/zRoZPzP 现在已经写了25个笔记! //@尘绳聋-SYSU:数盟的链接里没有标明原作:@tornadomeet [ [微博](http://www.weibo.com/5220650532/Borpttofb) ]
+
+> 2014-09-24 @陈利人: 好文!常见面试之机器学习算法思想简单梳理 http://t.cn/RhWuNHg [ [微博](http://www.weibo.com/1915548291/Bor6t48ji) ]
+
+2014-09-24 感谢! 附09年MLSS主页 http://t.cn/zl1sHfi 09年MLSS 所有还幻灯片打包下载 51M ZIP http://t.cn/RhWBmXr //@bigiceberg: mark,其中09年UK的mlss最经典。 [ [微博](http://www.weibo.com/5220650532/Borng7Ukv) ]
+
+> 2014-09-24 @好东西传送门: 机器学习暑期学校MLSS全集(2002-): MLSS汇集了机器学习界名师,提供基础教程,展示领域进展, 免费讲义下载 -- 是了解领域前沿的好去处。全集罗列了过去的26次课和未来的8次课, 基本上欧洲,美国,澳洲,亚洲各自一摊。原始链接 www.mlss.cc 我们做了个github版补全了缺失链接 http://t.cn/RhWRlBo [ [微博](http://www.weibo.com/5220650532/BoqHnj2qe) ]
+
+2014-09-24 //@AixinSG: 我们做过hashtag扩散的研究 http://t.cn/RhWmsw8 Google Scholar上也有了一些相关的引用文章 http://t.cn/RhWmswE 相对来说扩散要比溯源容易做,溯源很不容易验证 [ [微博](http://www.weibo.com/5220650532/Bor4eu5sU) ]
+
+> 2014-09-24 @好东西传送门: 问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文 http://t.cn/RhW6Suk 特别推荐Guille等"在线社交网络中信息扩散综述"(SIGMOD Record 2013)脑图, 讲了三个挑战及相关解法: 发现有趣话题,扩散过程建模, 识别高影响力节点。此外还有几篇溯源算法研究及一篇Science相关好文 [ [微博](http://www.weibo.com/5220650532/BoqRO7Mzg) ]
+
+2014-09-24 问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文 http://t.cn/RhW6Suk 特别推荐Guille等"在线社交网络中信息扩散综述"(SIGMOD Record 2013)脑图, 讲了三个挑战及相关解法: 发现有趣话题,扩散过程建模, 识别高影响力节点。此外还有几篇溯源算法研究及一篇Science相关好文 [ [微博](http://www.weibo.com/5220650532/BoqRO7Mzg) ]
+
+2014-09-24 机器学习暑期学校MLSS全集(2002-): MLSS汇集了机器学习界名师,提供基础教程,展示领域进展, 免费讲义下载 -- 是了解领域前沿的好去处。全集罗列了过去的26次课和未来的8次课, 基本上欧洲,美国,澳洲,亚洲各自一摊。原始链接 www.mlss.cc 我们做了个github版补全了缺失链接 http://t.cn/RhWRlBo [ [微博](http://www.weibo.com/5220650532/BoqHnj2qe) ]
+
+2014-09-23 [资料合集] http://t.cn/RhOz6bQ 情感分析(sentiment analysis) 两本经典综述PDF下载: A Survey of Opinion Mining and Sentiment Analysis (2012) by Bing Liu; Opinion mining and sentiment analysis (2008) by Bo Pang, Lillian Lee, 另附Richard Socher等深度学习用于情感分析的论文 欢迎补充 [ [微博](http://www.weibo.com/5220650532/Bohx6Ahic) ]
+
+2014-09-23 回复@禅系一之花: 谢谢提示。《傅立叶变换的简易指南》 http://t.cn/8srbg2x 译者:Taurelasse //@禅系一之花:译言上有翻译版 //@好东西传送门:感谢右边传送 An Interactive Guide To The Fourier Transform //@赶路人林文: http://t.cn/zjN3lQ6 这个傅里叶转换的文章是我看到 [ [微博](http://www.weibo.com/5220650532/Boh4Y1Doi) ]
+
+> 2014-09-19 @好东西传送门: 问: @ShawnLeesr 给找一些好到逆天的 1.信号处理 2 傅里叶变换 3.小波变换的入门资料吧 答: 资料整理 http://t.cn/RhKNdKs 推 @Heinrich_DMU 傅里叶分析之掐死教程。进阶有Stanford傅立叶变换课(Brad Osgood) http://t.cn/RhKNdKF , MIT小波分析课(Gilbert Strang) http://t.cn/RhKNd9v 请指正补充 [ [微博](http://www.weibo.com/5220650532/BnHcFiekf) ]
+
+2014-09-23 //@AllAboutStorage: Freebase小介绍(目标结构化internet)。母公司2010年被Google收购,其技术应该被用到了Google Knowledge Graph这个项目中。感兴趣的同学还可以看一看Google的图数据库Cayley http://t.cn/RvHuYpL 。其介绍就清楚写明:Cayley是受Google知识图谱以及Freebase背后的图数据库启发。 [ [微博](http://www.weibo.com/5220650532/Boh3LyNLP) ]
+
+> 2014-09-23 @好东西传送门: @low_accepted 问:求Freebase Wikipedia Extraction (WEX)的数据集(66GB大小,tsv格式) 答:AWS上有66GB版本的ESB snap-1781757e,挂靠在EC2上免下载。刚才实验了可用。WEX把维基百科英文版的模板、信息框、目录等转化为XML格式 http://t.cn/Rh0kIXp 更多Freebase资源 http://t.cn/Rh0kIX0 [ [微博](http://www.weibo.com/5220650532/Bogtpf4Jr) ]
+
+2014-09-23 问: @神经明亮的人 求perl教程呀? 答: 资料合集 http://t.cn/RhOvrpN Randal Schwartz 的learning Perl(小骆驼)是公认的入门教程, 浅显短小, 建议看英文版。更短有Learn Perl in about 2 hours 30 minutes. 更多看perlmonks.org和perl-tutorial.org的教程合集. 进阶看大骆驼Programming Perl 欢迎补充 [ [微博](http://www.weibo.com/5220650532/Boh22i7QV) ]
+
+2014-09-23 @low_accepted 问:求Freebase Wikipedia Extraction (WEX)的数据集(66GB大小,tsv格式) 答:AWS上有66GB版本的ESB snap-1781757e,挂靠在EC2上免下载。刚才实验了可用。WEX把维基百科英文版的模板、信息框、目录等转化为XML格式 http://t.cn/Rh0kIXp 更多Freebase资源 http://t.cn/Rh0kIX0 [ [微博](http://www.weibo.com/5220650532/Bogtpf4Jr) ]
+
+2014-09-23 感谢右边传送 An Interactive Guide To The Fourier Transform //@赶路人林文: http://t.cn/zjN3lQ6 这个傅里叶转换的文章是我看到的最棒的,无比生动。特别适合文科生,八年没碰过物理,五年没碰过数学的我都看懂了。有时间一定把这个翻译成中文。 [ [微博](http://www.weibo.com/5220650532/BofcOk20k) ]
+
+> 2014-09-19 @好东西传送门: 问: @ShawnLeesr 给找一些好到逆天的 1.信号处理 2 傅里叶变换 3.小波变换的入门资料吧 答: 资料整理 http://t.cn/RhKNdKs 推 @Heinrich_DMU 傅里叶分析之掐死教程。进阶有Stanford傅立叶变换课(Brad Osgood) http://t.cn/RhKNdKF , MIT小波分析课(Gilbert Strang) http://t.cn/RhKNd9v 请指正补充 [ [微博](http://www.weibo.com/5220650532/BnHcFiekf) ]
+
+2014-09-22 Yar, Yac, Yaf 都是 @Laruence 直接在GITHUB上开源的 http://t.cn/zWiKwkj , Zend Optimizer 也有他 http://t.cn/Rh0h8RZ [ [微博](http://www.weibo.com/5220650532/BoaTCoZbG) ]
+
+> 2014-09-22 @Laruence: 又要写总结报告了, 这是目前微博俩年来达成的LNMP的技术结构图..... 也就这么些东西, 大部分都是开源的, 欢迎借鉴. [ [微博](http://www.weibo.com/1170999921/BoaKMhnJp) ]
+
+2014-09-22 问: 增强现实近几年的文章或者相关资料特别是关于PTAM的资料? 答: 资料汇总 http://t.cn/Rh0v03Y PTAM是"即时定位与地图构建" (Simultaneous localization and mapping, SLAM, 机器人视觉的研究方向)的重要进展, 概念于2007年ISMAR最佳论文中提出。2014 CVPR 有一组段教程涉及相关研究 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BoaJeg31R) ]
+
+2014-09-22 传送好东西 #自然语言处理# 论文“Distributed Representations of Sentences and Documents ” Quoc V. Le, Tomas Mikolov, ICML 2014 链接 http://t.cn/RhpdQqv PV = Paragraph Vector [ [微博](http://www.weibo.com/5220650532/BoabnoAha) ]
+
+> 2014-09-22 @ustczen: “Distributed Representations of Sentences and Documents ”中提到的句子向量化算法PV-DM在github上已经有了基于gensim的python实现:http://t.cn/RPDxH82,word2vec论坛有人用它在IMDB数据集上尝试做情感分类,效果没有论文声称的那么牛,但可以参考下实现。@好东西传送门 [ [微博](http://www.weibo.com/2872565912/Bo9xyfdib) ]
+
+2014-09-22 感谢@hnlyjzh 搬运! Large Scale Visual Recognition Challenge视频免梯子下载 [ [微博](http://www.weibo.com/5220650532/Bo6SLASYp) ]
+
+> 2014-09-21 @hnlyjzh: ILSVRC2014的视频在这里http://t.cn/RhNBfX6 @好东西传送门 [ [微博](http://www.weibo.com/1244843177/Bo3i6cufT) ]
+
+2014-09-21 继续传送 //@ICT秦磊: 转了GoogLeNet,放在优酷上。 http://t.cn/RhN58TY 好东西传送门: 帮转,在YouTube上的,看看有没有大神帮忙传送回国 [ [微博](http://www.weibo.com/5220650532/Bo0laE8yh) ]
+
+> 2014-09-20 @贾旭kul_visics: @好东西传送门 ILSVRC2014 videos http://t.cn/RhCTDKX [ [微博](http://www.weibo.com/3195545915/BnUjy7FgT) ]
+
+2014-09-21 转发理论:一张图简明扼要总结了各种概率分布的关系,对机器学习和统计都极具参考价值。另补充维基百科上无版权的图 http://t.cn/zjyvP9q 并有对各种分布的详细解释 [ [微博](http://www.weibo.com/5220650532/BnYMPiRcz) ]
+
+> 2014-09-21 @_散沙_民工智能_: 基础中的基础,各路大数据科学家首先忽略的东西。晚安 http://t.cn/z8AJfHW [ [微博](http://www.weibo.com/1438548745/BnWtujF4q) ]
+
+2014-09-20 帮转,在YouTube上的,看看有没有大神帮忙传送回国 [ [微博](http://www.weibo.com/5220650532/BnVt2ffR0) ]
+
+> 2014-09-20 @贾旭kul_visics: @好东西传送门 ILSVRC2014 videos http://t.cn/RhCTDKX [ [微博](http://www.weibo.com/3195545915/BnUjy7FgT) ]
+
+2014-09-20 问: @情非得已小屋 推荐点关于推荐系统的综述么? 答: 问答207 http://t.cn/RhCt7lc 强推KDD2014讲义 "the recommender problem revisited": 第一部分Xavier Amatriain的综述(135页, 2014机器学习夏季学校版有248页), 第二部分"Context Aware Recommendation" (64页) 谢 @小飞鱼_露 @明风Andy 推荐 [ [微博](http://www.weibo.com/5220650532/BnRHSq1xl) ]
+
+2014-09-20 问: @水月小和尚 求隐私保护的资料 答: http://t.cn/Rh9egwV 隐私保护是大数据时代的重要问题。先推荐一篇2010年综述privacy-preserving data publishing 讲数据发布中的攻击模型, 隐私模型和匿名算法(看附图) 1.3节还列了一些综述, 讲"数据挖掘、数据查询、统计数据发布"中实现隐私保护 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BnPOcry6i) ]
+
+2014-09-20 过去一周新增的问答和推荐资源都整理到Github上了http://t.cn/Rh9NSVm 到目前为止有360条主题。要找以前推荐过的资源直接可以在页面上Ctrl+F搜索。BTW,如果你想订阅每周更新,发邮箱给我的私信吧 [ [微博](http://www.weibo.com/5220650532/BnMt3bdgh) ]
+
+
+2014-09-19 Large-Scale Distributed Computer Vision As A Cloud Service [ [微博](http://www.weibo.com/5220650532/BnImw9owp) ]
+
+> 2014-09-19 @Rachel____Zhang: 发现了一个好东西,cloudcv http://t.cn/RhKuArr . 基于GraphLab with GPU支持在线object detection, classification和feature extraction(用的是Caffe),提供了MATLAB和Python的API。http://t.cn/8FItstH 还有提供ILSVRC2014 的各种feature... [ [微博](http://www.weibo.com/2607574543/BnIlCguKb) ]
+
+2014-09-19 推荐Cyrille Rossant博士新书 “IPython cookbook” http://t.cn/RhKH1qp 所有例子在Github上以IPython Notebook方式开源 http://t.cn/RhKH1q0 此书覆盖挺广:基础知识( IPython交互式计算环境,性能分析与优化,高性能计算,数据可视化); 实战短例子(例如统计,机器学习,信号处理,视频与音频等) [ [微博](http://www.weibo.com/5220650532/BnHSNrqZT) ]
+
+2014-09-19 问: @ShawnLeesr 给找一些好到逆天的 1.信号处理 2 傅里叶变换 3.小波变换的入门资料吧 答: 资料整理 http://t.cn/RhKNdKs 推 @Heinrich_DMU 傅里叶分析之掐死教程。进阶有Stanford傅立叶变换课(Brad Osgood) http://t.cn/RhKNdKF , MIT小波分析课(Gilbert Strang) http://t.cn/RhKNd9v 请指正补充 [ [微博](http://www.weibo.com/5220650532/BnHcFiekf) ]
+
+2014-09-19 [有趣的数据] 一个新推出的可交互地图应用把英国(United Kingdom)的河流的水文数据(river level) 放在网上 http://t.cn/RhK9AoB 。地图每一点对应一个水文观测站,好玩的是大家可以在Twitter上当这个观测站的粉丝:牛津附近的 gauge 2100 http://t.cn/RhK9Aor 居然有12粉 [ [微博](http://www.weibo.com/5220650532/BnH0ncHSp) ]
+
+2014-09-19 好东西! [ [微博](http://www.weibo.com/5220650532/BnGKXl9Ic) ]
+
+> 2014-09-19 @设定控: 一篇在各大社交网站上广为转载的电子图书馆列表,来自译言网,《最好的免费电子图书馆指南(上)》http://t.cn/zYcbH8t 《最好的免费电子图书馆指南(下)》http://t.cn/z84nsDZ 事实我发的很多电子书网站就来自这里,这贴几乎无所不包,学术政治经济资源都有,楼主还没翻译完,有时间多刷新一下吧。 [ [微博](http://www.weibo.com/2142733793/BnGfghg3X) ]
+
+2014-09-19 赞!Gradient Boosting Tree也参我们以前收集的专题 http://t.cn/RhKc1F5 有Python Go C++多种语言的实现 [ [微博](http://www.weibo.com/5220650532/BnFUv89IL) ]
+
+> 2014-09-19 @phunter_lau: 我的 Kaggle Higgs Challenge单个模型获胜解答,公开排行榜3.75最终排行榜得分3.73,排名25th/1792,差不多前几十里唯一一个非组合模型的解答。至于为什么不用组合模型,因为我不会。。。 链接 http://t.cn/RhKAWac 附图方便不能上wordpress的同学观看。至于英语描述,不要在意这些细节。 [ [微博](http://www.weibo.com/1770891687/BnE9rmOpe) ]
+
+2014-09-19 推荐一篇综述,将Context Aware Computing 在物联网里的应用 《Context aware computing for the internet of things: A survey》 http://t.cn/RhKqJTg 分析了过去十年50个相关项目,覆盖Context生命周期的四个阶段 Acquisition(获取), Modeling(建模), Reasoning(推理), Distribution(发布) [ [微博](http://www.weibo.com/5220650532/BnFso1697) ]
+
+2014-09-19 回复@tang_Kaka_back: 大致看了一下pypi,4万多库里只有5千多的python3库 //@tang_Kaka_back:回复@好东西传送门:[good]Python3的一些库跟进还是太慢了。从unicode的角度我个人还是喜欢3 //@tang_Kaka_back:我记得我一年前在找python3的爬虫都没有太好的,于是自己就着自己的项目写了个。现在已经有支持 [ [微博](http://www.weibo.com/5220650532/BnDabp9IQ) ]
+
+> 2014-09-18 @好东西传送门: 问: @子_相 目前支持Python 3的各种Web Crawler包?输入HTML, 输出是能支持Xpath 和CSS式的selector查询的object,有没有比较宽松容错的parser? 答: http://t.cn/RhL3mGP 不完善初步答案 MechanicalSoup和robobrowser都支持python3; beautifulSoup4 支持多种html parser处理HTML和CSS 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BnyQKbcKJ) ]
+
+2014-09-19 回复@小粗腿正在减肥中: 你是指这个吗? http://t.cn/RhosnXP Information Hiding conference (1996-2014) 点链接可以看每一届会议的论文目录。要下载论文通常可以 1. 祭出搜索引擎 标题+PDF 2. 通过图书馆查期刊 3.联系通信作者 ... //@小粗腿正在减肥中: [ [微博](http://www.weibo.com/5220650532/BnD1wdQBF) ]
+
+> 2014-09-18 @好东西传送门: 问:求信息隐藏的资料 答:初步进展 http://t.cn/RhogJv4 信息隐藏(digital watermarking, steganography and steganalysis, anonymity and privacy)有一个国际年会 IIH-MSP (1996-2014)。 Zoran Duric 有2006年有一门短课程, Peter Wayner 有一本2009年的专著。@永远的孤岛 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BnCrqqYLC) ]
+
+2014-09-18 问:求信息隐藏的资料 答:初步进展 http://t.cn/RhogJv4 信息隐藏(digital watermarking, steganography and steganalysis, anonymity and privacy)有一个国际年会 IIH-MSP (1996-2014)。 Zoran Duric 有2006年有一门短课程, Peter Wayner 有一本2009年的专著。@永远的孤岛 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BnCrqqYLC) ]
+
+2014-09-18 [数据集] 美国各政府部门2000至2014财年的支出记录, 每条记录包括 哪个部门拨发的,什么时间,干什么用,多少钱,获得拨款的地址 等字段。可以直接查询数据 http://t.cn/RhotbLK 也可以下载数据 http://t.cn/RhotbLo (点 archives 标签, 按月下载) [ [微博](http://www.weibo.com/5220650532/Bnz8SvZTF) ]
+
+2014-09-18 问: @子_相 目前支持Python 3的各种Web Crawler包?输入HTML, 输出是能支持Xpath 和CSS式的selector查询的object,有没有比较宽松容错的parser? 答: http://t.cn/RhL3mGP 不完善初步答案 MechanicalSoup和robobrowser都支持python3; beautifulSoup4 支持多种html parser处理HTML和CSS 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BnyQKbcKJ) ]
+
+2014-09-18 传送好东西并传送问题 @左耳朵耗子 //@文艺复兴记: 我遇到过一类典型的有问题的编写可测试代码的方法,例:实现一个Stack类。有人这样做:把Stack内部的数据结构(比如动态数组)暴露出来,然后分别写两个测试用例test_push和test_pop,每个测试用例都去检查Stack内部数据结构的状态。问题在哪里? [ [微博](http://www.weibo.com/5220650532/Bnys4axnX) ]
+
+> 2014-09-18 @reeze: Google员工写的:《编写可测的代码》 http://t.cn/RhSENMV 代码可测性非常重要,规模越大越重要,可测的程序可以更容易的编写更多的测试来保证代码的质量。 [ [微博](http://www.weibo.com/1548943797/BnxVP6DMx) ]
+
+2014-09-18 好东西 回复@blue_tracks: 论文PDF 链接有问题. 是否考虑放到 arxiv.org 这样方便别人引用,源代码是这个(不在master上)吗? http://t.cn/RhoADCF [ [微博](http://www.weibo.com/5220650532/Bnymun0FA) ]
+
+> 2014-09-18 @blue_tracks: NIPS投稿得到887高分,但是最后因为一个math typo被干掉,郁闷过后现在paper和实验配置都已公开。 idea极其简洁, 在中间层加入监督信息的架构可以适用于任何网络结构, 我们有理论和多个数据集的实验证明这种策略能够有效防止梯度发散,据说GoogLeNet今年也用了类似的想法 http://t.cn/Rhoz0BO @winsty [ [微博](http://www.weibo.com/1240701945/Bny5ShuSM) ]
+
+2014-09-18 特别推荐一本免费电子书: 微软研究院邓力和俞栋合写的“Deep Learning Methods and Applications” (2014) http://t.cn/RhoPwll 近200页篇幅对深度学习的方法和应用做了比较全面地综述。还有 @高杰_Speech 推荐 微软研究院出品C++开源Computational networks工具包 CNTK http://t.cn/Rhy4u3l [ [微博](http://www.weibo.com/5220650532/BnxSMyLB3) ]
+
+2014-09-18 哈哈, 原来是微软研究院出品 Computational Network Toolkit (CNTK) 俞栋 Dong Yu etc. "An Introduction to Computational Networks and the Computational Network Toolkit", Microsoft Technical Report, 2014. http://t.cn/RhSscXz //@liushengbing: 只支持windows的ML包真是第一次见 [ [微博](http://www.weibo.com/5220650532/BnxKrvfUY) ]
+
+> 2014-09-12 @高杰_Speech: 推荐新的Deep learning工具包 CNTK, http://t.cn/Rhy4u3l C++实现,CPU/GPU支持,DNN/CNN/RNN/LSTM,目前只支持windows [ [微博](http://www.weibo.com/2436946631/BmEk7BQfM) ]
+
+2014-09-18 不错 补充一下 ILSVRC2014 的日程上包括了各大参赛队15分钟报告幻灯片下载链接,还有各种讨论的东东 http://t.cn/RhSF13U //@潘炎_SYSU: 相应的论文链接在: http://t.cn/RhSdt1V [ [微博](http://www.weibo.com/5220650532/BnxIm4KOD) ]
+
+> 2014-09-18 @潘炎_SYSU: GoogleLeNet放出他们在ILSVRC 2014的slides了:http://t.cn/RhSdCVa [ [微博](http://www.weibo.com/1889275224/Bnxk2a7zQ) ]
+
+2014-09-18 问: @微热闹 请教是否有MAPREDUCE实现的PLSI算法 答: http://t.cn/RhSnzB7 先来三篇相关文章: UIUC “Parallel PLSI on Spark”, 清华“Parallel PLSA ...” 南大“P2LSA and P2LSA+: Two Paralleled Probabilistic Latent Semantic Analysis Algorithms Based on the MapReduce Model” 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BnwGrtAwU) ]
+
+2014-09-18 关于数据清理(Data Cleaning) 有一篇2000年的经典文章 "Data Cleaning: Problems and Current Approaches" http://t.cn/RhSE7LZ 该文综述了结构化数据中质量问题的分类和来源,并给出了相应例子。该文对了解当前大数据中"噪音”有一定指导意义。#抛砖引玉# 欢迎补充推荐好东西 [ [微博](http://www.weibo.com/5220650532/BnwznznUE) ]
+
+2014-09-18 问: 关于挖掘话题层级结构(topic hierarchy)的研究和应用? 答: http://t.cn/RhSTd26 早期有CAM模型(IJCAI'99), 近来有Blei基于"bayesian nonparametric inference"的工作, Berant的"entailment graph", 微软ProBase. Twitter用它分类(kdd'14). 认知科学看"How to Grow a Mind"(science'11) 欢迎指正 [ [微博](http://www.weibo.com/5220650532/BnvY6x7Oq) ]
+
+2014-09-17 #温故而知新# Gary Anthes (科普作家)的 Deep Learning Comes of Age 算是科普文章了,短短几页谈了深度学习过去与现状的要点,还推荐了一个不错的参考论文书单。正好 🚪 正在传送 深度学习入门资料 http://t.cn/RhaTq9c 该文应该被”录用“ 又 @自觉自愿来看老婆微博 也推荐该文 [ [微博](http://www.weibo.com/5220650532/BnoQ6ksvb) ]
+
+> 2013-05-30 @星空下的巫师: "A wave of excitement today comes from the application of unsupervised learning to deep neural nets." Deep Learning Comes of Age | June 2013 | Communications of the ACM http://t.cn/zH5EdjT [ [微博](http://www.weibo.com/1785748853/zz47bmU5h) ]
+
+2014-09-17 问:@聪Hit 有没有关于深度学习的。特别是针对初学者的一些文章。 答: 深度学习综述不乏大部头,如微软邓力等写的“Deep Learning Methods and Applications”。推些短文:"A Primer on Deep Learning" 科普入门, 基于python theano范例学习, 邓侃Deep Learning系列 资料 http://t.cn/RhaISCG 欢迎指正 [ [微博](http://www.weibo.com/5220650532/Bnnfrjm3x) ]
+
+2014-09-17 问:@vincent是正能量 有没有synonym mining的survy paper,以及比较核心的一些paper? 答: 问答资料 http://t.cn/Rha5DJE Wordnet synset 人工构造了同义词(synonym)集合, 自动方法通常依靠语义相关分析(semantic similarity) 微软有相关项目, 我们有技术资料整理贴 http://t.cn/Rha5DJR [ [微博](http://www.weibo.com/5220650532/BnmMGBraU) ]
+
+2014-09-17 [专题] 主题模型 工具推Gensim和LDAvis http://t.cn/RhabYR5 理论部分推荐 @52nlp 的《如何计算两个文档的相似度》@rickjin 的《LDA数学八卦》@Copper_PKU 的《Probabilistic Topic Model》和 沈志勇 的《主题模型简介》http://t.cn/RhabYRt 研究前沿推Twitter和Google的实战 http://t.cn/RhabYRc [ [微博](http://www.weibo.com/5220650532/BnmjIC2Tr) ]
+
+2014-09-17 [专题] 主题模型 工具推Gensim和LDAvis http://t.cn/RhabYR5 理论部分推荐 @52nlp 的《如何计算两个文档的相似度》@rickjin 的《LDA数学八卦》@@Copper_PKU的《Probabilistic Topic Model》和 沈志勇 的《主题模型简介》http://t.cn/RhabYRt 研究前沿推Twitter和Google的实战 http://t.cn/RhabYRc [ [微博](http://www.weibo.com/5220650532/Bnmjn3rmn) ]
+
+2014-09-16 Luke现在是Google Product Director 关心手机平台Ux设计地同学们可以下载资料了,PDF有78页 http://t.cn/zQan8tv //@DataMooc: //@developerWorks: 这个很不错,LukeW 大神的 Blog 是长期订阅的,推荐。PDF 下载地址: http://t.cn/RhXST8L [ [微博](http://www.weibo.com/5220650532/Bnh75kMAe) ]
+
+> 2014-09-16 @英特尔XDK: Luke Wroblewski 大神正式的把他从 2012-2014年写的关于 #Mobile Design# 的文章整理成了 iBook 和 PDF 发布了,大家可以从他的网站上得到下载链接 http://t.cn/RhXVIlD。您也可以从 @英特尔开发人员专区 来了解他的文章和视频 http://t.cn/RhXVIlk [ [微博](http://www.weibo.com/5075403624/Bng3ijjEq) ]
+
+2014-09-16 转发理由:深度学习在分词等领域的应用。论文PDF http://t.cn/RhX2U9t HTML版 http://t.cn/RhX2U95 [ [微博](http://www.weibo.com/5220650532/Bnf4S6g8I) ]
+
+> 2014-09-15 @裴文哲: 终于找到了 http://t.cn/Rh6GFMi 我在ACL2014的oral presentation: Max Margin Tensor Neural Network for Chinese Word Segmentation 介绍了Deep Learning在序列标注任务中的新模型 slides做的略挫 希望大牛们轻喷 [ [微博](http://www.weibo.com/2110794314/Bn8SNfgHJ) ]
+
+2014-09-16 转发理由:依存文法分析对于关系提取,问答系统和知识图谱建设都有突出价值,而且速度较快。 [ [微博](http://www.weibo.com/5220650532/BneFP04pJ) ]
+
+> 2014-09-16 @李正华NLP: 我们这次在coling 2014上做的题为“Dependency Parsing: Past, Present, and Future”的tutorial slides已经整理好并放在我的主页上:http://t.cn/RhXvXVn,请大家多提宝贵意见,欢迎讨论交流。 [ [微博](http://www.weibo.com/1890969215/BnevukUcc) ]
+
+2014-09-16 回复@海中的沙粒: 发这个好东西时有点纠结,很多人见过,也有很多人没见过。但是作为数据,它的价值的确高,第一省得去翻统计年鉴,第二 CSV很容易导入Excel,python,matlab, R, 省了不少数据清理时间 (转就是收藏,不论你是不是 @ 谁的印象笔记 ) //@海中的沙粒:好像转过,再转一次吧,嘿嘿,反正 [ [微博](http://www.weibo.com/5220650532/BneyPc0Qp) ]
+
+> 2014-09-16 @好东西传送门: 推荐 @新浪财经 "中国宏观经济数据" http://t.cn/Rh6us2R 涵盖: 国民经济, 价格指数, 居民收入, 固定资产投资, 景气指数, 对外经济贸易, 金融信息, 国家财政, 行业信息。有图表且数据可CSV导出。轻松解决问题189 我国CPI和货币供应量M2 M1 M0月度环比数据 http://t.cn/Rh6HucY [ [微博](http://www.weibo.com/5220650532/Bndsqh1hJ) ]
+
+2014-09-16 读综述帮助了解领域,写综述展示对领域的掌握程度。找文献时要聚焦在目标课题下,避免贪多求全或者枝蔓。 高质量的例子可以参考计算机领域的综述期刊(ACM Computing Survey) 附DBLP的每期链接 http://t.cn/Rh6rH83 //@陆浑戎: 转发微博 [ [微博](http://www.weibo.com/5220650532/BndSKAQj8) ]
+
+> 2014-09-15 @传媒老跟班: 【文献综述】文献综述的写法http://t.cn/Rh6onsx;本科毕业论文如何撰写文献综述?http://t.cn/zHKQB8G;如何写文献综述?http://t.cn/zHKQB8b;克雷斯威尔五步文献综述法http://t.cn/Rh6onsa;社会科学研究中的文献综述:原则、结构和问题http://t.cn/zHKQB8q,供大家参考。 [ [微博](http://www.weibo.com/5198011111/BnapLe2fO) ]
+
+2014-09-16 转发理由:包括n-gram,带Freebase标注的8亿文档, Wikilinks 4000万页面链接标注,人工标注的wikipedia公众人物到Freebase映射, 3900万Wikipedia Infobox编辑历史,词与实体的映射 [ [微博](http://www.weibo.com/5220650532/BndMfgjn7) ]
+
+> 2014-09-15 @龙星镖局: Google近年来发布的有关文本挖掘、自然语言处理的数据集。http://t.cn/z8sMlZv [ [微博](http://www.weibo.com/1830516311/Bn7Q3zieO) ]
+
+2014-09-16 问: @海中的沙粒 点餐,介绍Matlab的入门级编程语言的书,电子文献,或者网页类 答: 任选一个套餐用最快速度翻完掌握全局,具体细节使用时再读。资料汇总 http://t.cn/Rh63woo 有18页的短教程,MIT的5节课讲义,Rutgus经济系博士的讲义。此外大餐看官方手册"Matlab Primer" [ [微博](http://www.weibo.com/5220650532/BndHDcwWV) ]
+
+2014-09-16 推荐 @新浪财经 "中国宏观经济数据" http://t.cn/Rh6us2R 涵盖: 国民经济, 价格指数, 居民收入, 固定资产投资, 景气指数, 对外经济贸易, 金融信息, 国家财政, 行业信息。有图表且数据可CSV导出。轻松解决问题189 我国CPI和货币供应量M2 M1 M0月度环比数据 http://t.cn/Rh6HucY [ [微博](http://www.weibo.com/5220650532/Bndsqh1hJ) ]
+
+2014-09-16 问: @国产_小翁:能不能帮我找到HMAX模型的matlab源码? 答: 资料汇总 http://t.cn/Rh69oet HMAX ("Hierarchical Model and X") 是Poggio于1999年提出的概念, 用于解决(Object recognition)的多层次神经网络。Poggio的MIT实验室CBCL在Google code有纯matlab源码 欢迎指正 [ [微博](http://www.weibo.com/5220650532/Bndd4cmz5) ]
+
+2014-09-16 要不搜索一下,用这个关键词 win7 library-ms fix 找到相关的问答 http://t.cn/Rh6juZn http://t.cn/Rh6juZm 更多相关结果看这里 http://t.cn/Rh6juZE 此外可以直接问微软 @微软中国 [ [微博](http://www.weibo.com/5220650532/BnbJ2h4gS) ]
+
+> 2014-09-15 @举头三尺有大神: 求助各位大神@好东西传送门 @破破的桥 @林楚方 。win7库出现这种情况。不能打开,不能新建,还原默认还是无法解决。 [ [微博](http://www.weibo.com/2809984842/Bn8VQnsUW) ]
+
+2014-09-16 如果你注了NIPS ,这个workshop就不另外收费了,看注册页 http://t.cn/Rh696S3 //@duinduin:要另外注册么? //@好东西传送门:Automated Knowledge Base Construction (AKBC) 2013 http://t.cn/Rhi9Tr5 2014年的和NIPS一起开,期待! //@昊奋: AKBC算是一个引领知识库构建的专题workshop。推荐的这 [ [微博](http://www.weibo.com/5220650532/BnazMCYTf) ]
+
+> 2014-09-15 @小飞鱼_露: @好东西传送门 想问下身边有没有了解知识图谱 (knowledge graph) 的大神,能否推荐一些文章和教程? [ [微博](http://www.weibo.com/1761583707/Bn4ljd4QQ) ]
+
+2014-09-15 //@算文解字:5. 这哥们很能掰,而很多章节分别阐述了他对人工智能、医疗科技、清洁能源、90年代互联网历史、融资甚至帝王之术的独特看法。很多地方只是略略扫了一眼,总感觉是可读性很强。原始Note: http://t.cn/zYvtV0F 最近已经整理成书“Zero to One” @好东西传送门 前两天推荐过 [ [微博](http://www.weibo.com/5220650532/BnahOEAAQ) ]
+
+> 2014-09-15 @算文解字: 1 昨天读了Peter Theil CS183的笔记。他认为从0到1的过程是一个发现只有少数人才掌握的真相,即#秘密#的过程。简单的早被发现,变为常识应用在从1到n的复制阶段,而无解的秘密则毫无价值,因此需要找中等难度但可解的秘密。他提到的秘密有垄断、幂律、渠道的重要性以及元秘密:世界上仍有很多秘密。 [ [微博](http://www.weibo.com/1884715211/Bn9gN4EYh) ]
+
+2014-09-15 Automated Knowledge Base Construction (AKBC) 2013 http://t.cn/Rhi9Tr5 2014年的和NIPS一起开,期待!//@昊奋: AKBC算是一个引领知识库构建的专题workshop。推荐的这个paper算是一个比较有指导性意见的文章,推荐! [ [微博](http://www.weibo.com/5220650532/Bn4YS4wfC) ]
+
+> 2014-09-15 @小飞鱼_露: @好东西传送门 想问下身边有没有了解知识图谱 (knowledge graph) 的大神,能否推荐一些文章和教程? [ [微博](http://www.weibo.com/1761583707/Bn4ljd4QQ) ]
+
+2014-09-15 这个和昨天推荐的entity linking的两个教程结合看最佳 http://t.cn/RhiS9gW 。RPI Heng Ji出品 //@Copper_PKU: 我推荐一个reading list: http://t.cn/8FqFegC 不知道有人推荐过没有 这个主页很不错//@好东西传送门: 在我们的github主页上搜“知识图谱” http://t.cn/RhiX0pi [ [微博](http://www.weibo.com/5220650532/Bn4Iwe0wd) ]
+
+> 2014-09-15 @小飞鱼_露: @好东西传送门 想问下身边有没有了解知识图谱 (knowledge graph) 的大神,能否推荐一些文章和教程? [ [微博](http://www.weibo.com/1761583707/Bn4ljd4QQ) ]
+
+2014-09-15 在我们的github主页上搜“知识图谱” http://t.cn/RhiX0pi 有不少以前的问题了。专家推荐 @昊奋 @孙明明_SmarterChina @Gary南京 @李志飞AI 还有去年第一届全国中文知识图谱研讨会的嘉宾 http://t.cn/8k2VD2H 该网页还有很多PPT [ [微博](http://www.weibo.com/5220650532/Bn4y7coge) ]
+
+> 2014-09-15 @小飞鱼_露: @好东西传送门 想问下身边有没有了解知识图谱 (knowledge graph) 的大神,能否推荐一些文章和教程? [ [微博](http://www.weibo.com/1761583707/Bn4ljd4QQ) ]
+
+2014-09-15 问: @秦彦霞_HIT 求教,哪里有大规模Twitter数据(只包含tweet即可,最好billion级别)可在文章中引用或致谢。 答:资料汇总 http://t.cn/RhiIgsl Archiveteam 2012至2014每月都有几十G的tweet JSON数据。此外 数据堂、snap和nist也有数据 @kite1988 @齐浩亮 提供了资料, 参考twitter专家 @AixinSG [ [微博](http://www.weibo.com/5220650532/Bn3USp5oO) ]
+
+2014-09-14 谢谢补充,ACL2014 A tutorial on Wikification and Entity Linking http://t.cn/RhJHk2Q 是个203页的PPT //@唐都钰HIT-SCIR: 还有今年ACL. Dan Roth. Heng ji 的tutorial [ [微博](http://www.weibo.com/5220650532/BmYLL8mDL) ]
+
+> 2014-09-14 @好东西传送门: @昊奋 推荐:Edgar Meij (Yahoo Labs)的Entity Linking and Retrieval教程。该教程最早在WWW 2013做过,深受好评,后来在SIGIR 2013, WSDM 2014不断更新。这组是今年6月最新的在Montreal做的版本,分为实体链接,实体检索和语义搜索三部分 http://t.cn/RhJHfzc [ [微博](http://www.weibo.com/5220650532/BmYGPj6rK) ]
+
+2014-09-14 @昊奋 推荐:Edgar Meij (Yahoo Labs)的Entity Linking and Retrieval教程。该教程最早在WWW 2013做过,深受好评,后来在SIGIR 2013, WSDM 2014不断更新。这组是今年6月最新的在Montreal做的版本,分为实体链接,实体检索和语义搜索三部分 http://t.cn/RhJHfzc [ [微博](http://www.weibo.com/5220650532/BmYGPj6rK) ]
+
+2014-09-14 问: @Joyce-Yuan- 对于拼写错误(real-word error) 求中文类似资料? 答: 详见 http://t.cn/RhJSrlc 拼写错误分non-word和real-word, 中英文难点不同。SIGHAN7的Bake-off 2013: Chinese Spelling Check 有很多论文(十月CLP14在武汉开), 英文spelling correction看Peter Novig 07年文章(21行python实现) [ [微博](http://www.weibo.com/5220650532/BmXdqD5Eh) ]
+
+2014-09-13 问: @V井颠V 对国内中长文章(300~5000字)近似新闻门户网站频道粒度的自动分类,有好的模型方法? 答: 资料整理 http://t.cn/Rhx4dAf 考虑statistical topic model, 推荐UIUC翟成祥短教程 http://weibo.com/5220650532/BhWo26Y93 ,软件包Gensim,Mallet,Stanford; kdd14有twitter分类好文 欢迎补充 [ [微博](http://www.weibo.com/5220650532/BmNjFtkeg) ]
+
+2014-09-13 问: @钱知易 帮我找找Berkeley detector(边缘检测)的代码(C++,Matlab) 答:资料整理 http://t.cn/RhMkEbD 是Michael Maire的工作 “Contour Detection and Image Segmentation"(CVPR2011) , 找到他们组的原始代码(gPb),还有Hyunho Lee的改进算法(gPb-junctions) 卡片盒子 http://t.cn/RhMkEbe [ [微博](http://www.weibo.com/5220650532/BmLNZ10CR) ]
+
+2014-09-13 问: 求助关于统计学方面的入门知识,主要是写企业上报数据,我们收集整理完数据之后以样本信息推断总体情况,并分析和推测总体的特征和规律 答: 相关资料 http://t.cn/RhMDApx * http://t.cn/hrmAiI 中国统计网, 从excel开始 * http://t.cn/hbvjNH 统计学知识社区, 侧重R @统计之都 @陈茁博士_Adam [ [微博](http://www.weibo.com/5220650532/BmLDph6KB) ]
+
+2014-09-13 回复@波多野丽猪: 多谢补充 http://t.cn/RhMe2Pp Fuseki: serving RDF data over HTTP //@波多野丽猪:一般python的话用sparql wrapper是ivan herman他们弄的,比较靠谱;其实假如有了一个endpoint,用fuseki里面sparql on http调用也可以,当然需要关联上fuseki的jar, [ [微博](http://www.weibo.com/5220650532/BmLwarUeq) ]
+
+> 2014-09-13 @好东西传送门: 问: @扛着甘蔗 有没有python访问使用dbpedia,freebase,等这些知识库查询的demo? 答: stackoverflow 有相关例子,找了一些相关资源 http://t.cn/RhMdlpG 有一个用freebase实现entity linking的例子 Quepy有例子展示如何将自然语言问题转化为数据库查询 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BmLjK6gVv) ]
+
+2014-09-13 常见的语音算法phonetic algorithm就是设定一组规则,将文字映射到某种音标符号系统。例如最原始的Soundex算法 扔掉所有元音,映射 b, f, p, v → 1 然后通过比较映射后符号串的差异来计算发音相似度。原帖中的脑图列举了常见英语(及德语)映射算法以及相关开源代码(python, java, go, ruby, perl) [ [微博](http://www.weibo.com/5220650532/BmLqi92Vx) ]
+
+> 2014-09-11 @好东西传送门: 问:@付超群 不知道有没有中文发音相似度计算算法或者类库?比如北京 百斤 鼻颈 背景 如果可以顺道比较英文更好,比如peking,beking 答: 关于算法和开源代码整理了一个 #脑图#,问答进展和相关资料在 http://t.cn/Rhf5xio 还收录了一些相关论文(含汉语) 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BmsMAeh0K) ]
+
+2014-09-13 可以结合以前推荐的图数据库专题看 http://t.cn/RhMgVCF [ [微博](http://www.weibo.com/5220650532/BmLpwdOXs) ]
+
+> 2014-09-13 @西瓜大丸子汤: 赞OrientDB,超级方便灵活,JSON进,SQL出,随时可以改数据结构,即使不做图计算也有用。MySQL, ElasticSearch, MongoDB, Neo4j, Redis一圈下来,还是OrientDB最符合我的需要,表达力最好,学习成本最低。速度OK不算最好,不过机器速度根本不是系统瓶颈,而且有很多优化的办法。 http://t.cn/RhMgLvG [ [微博](http://www.weibo.com/1932835417/BmLo6bLIV) ]
+
+2014-09-13 问: @扛着甘蔗 有没有python访问使用dbpedia,freebase,等这些知识库查询的demo? 答: stackoverflow 有相关例子,找了一些相关资源 http://t.cn/RhMdlpG 有一个用freebase实现entity linking的例子 Quepy有例子展示如何将自然语言问题转化为数据库查询 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BmLjK6gVv) ]
+
+2014-09-13 推荐一个很惊艳的免费图库列表(来自wikimedia):很多public domain图片库完全免费没有版权问题,还有不少基于知识共享许可(creative commons)的免费图片库 http://t.cn/RhMu3GQ 内容包罗万象:生物,科学,历史,天文,地图,各国风情,艺术,体育... 有的图库有上千万张图片。附图为长微博级目录 [ [微博](http://www.weibo.com/5220650532/BmKnCgD1s) ]
+
+2014-09-13 传送理由:人工智能资源库 3000+资源,12个分类,根据喜好,点击率排序 //@王海勋haixun: 转发微博 [ [微博](http://www.weibo.com/5220650532/BmJ7XfW8r) ]
+
+> 2014-09-12 @BoxingChen: 开源工具和开放的数据越来越多,口碑如何?怎么选择呢?open AI Resource http://t.cn/RhMCIKC 收集了AI领域的很多工具和数据,分类让大家点赞和评论。机器学习领域暂时获赞领先的工具是libsvm,NLP领域的是斯坦福POS tagger。去那找你需要的open source,也去那为你喜欢的,或自己的工具点个赞吧。 [ [微博](http://www.weibo.com/1767949300/BmHFV4Te9) ]
+
+
+
+2014-09-13 传送: Searchable full-text transcripts of WWDC sessions (2010-2014)音频转字幕,全文检索所有录像发言 [ [微博](http://www.weibo.com/5220650532/BmIenexms) ]
+
+> 2014-09-12 @容芳志: 每年Apple WWDC大会的keynote和课程文字版都在这里,整理的太好了,忍不住分享: http://t.cn/z8exsaz [ [微博](http://www.weibo.com/1776143133/BmCBXyoqs) ]
+
+2014-09-12 讨论得很热闹, github几十楼整理了相关资料: entity linking/extraction/resolution, relation extraction; 咱还时光逆流传送了几个去年相关微博到评论里,尤其是李志飞那条里有不少高人评论,千万别错过。有没有人讲讲 michael jordan 'full merger of "data" and "knowledge"' http://t.cn/RhMwimZ [ [微博](http://www.weibo.com/5220650532/BmEOb3aqm) ]
+
+> 2014-09-12 @好东西传送门: 代人请教: #语义识别包含哪些关键技术# ? 咱先推荐 @白硕SH 老师近日的访谈《语义技术探索》阐述了相关基本概念 http://t.cn/RvWEZdm 请各位专家帮忙梳理思路、推荐入门资料 @刘群MT-to-Death @刘知远THU @52nlp @孙明明_SmarterChina @昊奋 @波多野丽猪 我们会把相关资料更新到 http://t.cn/RhICLfS [ [微博](http://www.weibo.com/5220650532/BmBEvzLES) ]
+
+2014-09-12 一点拙见,计算机在一些领域已经做得比人好了;而人对自然语言处理期望更高一些, 图灵测试 和 人脸识别 哪个难度更大?顺路给个文字版传送门 http://t.cn/RhMZVIV //@xierqi: 没想到Jordan对text一直这么有兴趣。抛开Deep Learning不讲,当前计算机对text的理解能力是否比image、vision要好不少? [ [微博](http://www.weibo.com/5220650532/BmEHn5jwn) ]
+
+> 2014-09-11 @王海勋haixun: Someone asked Michael Jordan if he's to lead a research project with 1 billion dollar funding, what will he do? Here is his answer. [ [微博](http://www.weibo.com/2083726665/BmyEhvaCd) ]
+
+2014-09-12 这本书还没上市呢,还没有电子书。着急的同学可以先看Blake Masters 的笔记 http://t.cn/zYvtV0F Notes Essays—Peter Thiel’s CS183: Startup—Stanford, 2012 顺路科普一下 Peter Thiel, Paypal 的联合创始人,facebook的天使投资人 http://t.cn/RhMhPTs [ [微博](http://www.weibo.com/5220650532/BmEoXfLhN) ]
+
+> 2014-09-12 @好东西传送门: 推荐Peter Thiel新书《Zero to One: Notes on Startups, or How to Build the Future》(9月16日才出版) http://t.cn/RhMPClT 基于他2012年CS183课的讲义。有人预读后赞了他的三个观点: 创始人要追求垄断, 用破坏性创新参加市场竞争不如开发新市场, 对精益创业的反思。咱做了个脑图(水平有限,欢迎指正) [ [微博](http://www.weibo.com/5220650532/BmEmhug9C) ]
+
+2014-09-12 推荐Peter Thiel新书《Zero to One: Notes on Startups, or How to Build the Future》(9月16日才出版) http://t.cn/RhMPClT 基于他2012年CS183课的讲义。有人预读后赞了他的三个观点: 创始人要追求垄断, 用破坏性创新参加市场竞争不如开发新市场, 对精益创业的反思。咱做了个脑图(水平有限,欢迎指正) [ [微博](http://www.weibo.com/5220650532/BmEmhug9C) ]
+
+2014-09-12 问: @波多野丽猪 有没有人了解建立partial order lattice的算法? 应该是Formal Concept Analysis(FCA)的东西。我有一堆logical term set, 想要建立一个关于set subsumption的lattice 答: FCA很相关 http://t.cn/RhIE0Sy 推荐Poelmans等的综述(分析了一千多论文) 并参考association rule 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BmD42j7k0) ]
+
+2014-09-12 要专注、要市场驱动 “an eighth waste was... manufacturing goods or services that do not meet customer demand or specifications.” http://t.cn/RhIjiTc //@张颖峰: 我倒是觉得这本书更容易给一些没头脑的创业者以快速迭代为借口连续不断试错,最后反而忘了自己要做什么,从而导致更大的浪费。 [ [微博](http://www.weibo.com/5220650532/BmCsnmc20) ]
+
+> 2014-09-12 @好东西传送门: 从 #精益生产# 到 #精益创业# 《精益创业》是近年很火的创业手册, 其核心理念是:快速迭代,减少浪费,避免不必要的开发。作者Eric Ries的观点来自#工业工程#书籍。他吸收了丰田lean manufacturing的成功经验:用最少工作创造价值, 尽可能降低浪费 - 例如著名的零库存思想. 书单 http://t.cn/RhICRq5 [ [微博](http://www.weibo.com/5220650532/BmBK1rnHP) ]
+
+2014-09-12 从 #精益生产# 到 #精益创业# 《精益创业》是近年很火的创业手册, 其核心理念是:快速迭代,减少浪费,避免不必要的开发。作者Eric Ries的观点来自#工业工程#书籍。他吸收了丰田lean manufacturing的成功经验:用最少工作创造价值, 尽可能降低浪费 - 例如著名的零库存思想. 书单 http://t.cn/RhICRq5 [ [微博](http://www.weibo.com/5220650532/BmBK1rnHP) ]
+
+2014-09-12 代人请教: #语义识别包含哪些关键技术# ? 咱先推荐 @白硕SH 老师近日的访谈《语义技术探索》阐述了相关基本概念 http://t.cn/RvWEZdm 请各位专家帮忙梳理思路、推荐入门资料 @刘群MT-to-Death @刘知远THU @52nlp @孙明明_SmarterChina @昊奋 @波多野丽猪 我们会把相关资料更新到 http://t.cn/RhICLfS [ [微博](http://www.weibo.com/5220650532/BmBEvzLES) ]
+
+2014-09-12 问:求Morden Japanese Society Study资料文献, 最好economy相关 答:http://t.cn/RhIoU0o《菊与刀》(The Chrysanthemum and the Sword)和《纵式社会的人际关系》(タテ社会の人間関係)都是研究日本近代社会(自明治维新起)的经典著作。《A Short Economic History of Modern Japan》300+学术引用 [ [微博](http://www.weibo.com/5220650532/BmB8tzbaE) ]
+
+2014-09-12 [赞]补充《GPU高性能编程CUDA实战》豆瓣书评 http://t.cn/htUpV0 pdf网上有 [ [微博](http://www.weibo.com/5220650532/BmzhXfaOu) ]
+
+> 2014-09-12 @Rachel____Zhang: 感谢某童鞋推荐CUDA Application Design and Development,看了目录和开头一章,感觉和《GPU高性能编程CUDA实战》结合起来看会收获更快[嘻嘻]代码在这里http://t.cn/RhIt1JA [ [微博](http://www.weibo.com/2607574543/Bmz3lvXTZ) ]
+
+2014-09-11 谢谢指正,是我们理解有误。那四本也是博士级的,向大家道歉🙇 //@王树森CS: 同意右边。除了第1本,其余根本不是入门的,我不知道微博上的人有几个能看得懂而且会去看。发这个东西的人要么不懂,要么骗粉。//@梁斌penny: 书看了,再把试验做一遍,我估计怎么也得需要4-5年。 [ [微博](http://www.weibo.com/5220650532/BmvfRfWTw) ]
+
+> 2014-09-11 @好东西传送门: #机器学习# 大牛Michael Jordan教授(Andrew Ng的博士导师) 近日在Reddit上推荐的书单。以前的书单12本针对有志于在机器学习领域奉献青春的博士生,这次新推荐了4本覆盖基础概念图书,帮助工业界读者在几个月内理解概念然后出活 。书单看这里 http://t.cn/RhfxqAz 卡片盒子 http://t.cn/RhfxqA7 [ [微博](http://www.weibo.com/5220650532/BmtoM2jCK) ]
+
+2014-09-11 赞王益的博客 注意未公开的“Google Rephil"//@丕子: 嗯,王益之前一blog分析了这个: http://t.cn/RhfXqBu , 另外Google PLDA+有10K topics, Rephil有100K,Peacock有1000K topics..//@lib_ustc: 对,训练出来的topic中的概率主要还是集中在高频信息上,对长尾描述较弱//@丕子: 长尾信息丢失太多了 [ [微博](http://www.weibo.com/5220650532/BmuiNg9dC) ]
+
+> 2014-09-11 @大山坡的春: 今天Jimmy Lin表示他在twitter的时候把topic models都试过了,没有一个work的~然后说,我告诉你个只有ir圈子里的人才晓得的topic model的毛病。。。#强迫症都没救了 @仙人掌不浇水 @丕子 [ [微博](http://www.weibo.com/1653082237/Bmtr4a69Q) ]
+
+2014-09-11 [笔记]Michael Jordan论#深度学习# http://t.cn/RhfoAhi 1. layer,parallel,ensemble有用,不能限于模拟人脑思维 2. backpropagation是关键, 本质是supervised learning 3. 很多成功案例是大规模样本+监督学习 4. 很少用在工业界咨询,不少其它问题(7个例子) 5. 机器学习要接近system与数据库, 远离AI [ [微博](http://www.weibo.com/5220650532/BmtY3eXDx) ]
+
+2014-09-11 #机器学习# 大牛Michael Jordan教授(Andrew Ng的博士导师) 近日在Reddit上推荐的书单。以前的书单12本针对有志于在机器学习领域奉献青春的博士生,这次新推荐了4本覆盖基础概念图书,帮助工业界读者在几个月内理解概念然后出活 。书单看这里 http://t.cn/RhfxqAz 卡片盒子 http://t.cn/RhfxqA7 [ [微博](http://www.weibo.com/5220650532/BmtoM2jCK) ]
+
+2014-09-11 择日不如今日: Statistics With Ruby: Time Series and General Linear Models http://t.cn/RhffVQ3 问答166 http://t.cn/RhffVQu [ [微博](http://www.weibo.com/5220650532/Bmt9bsMDN) ]
+
+> 2014-09-11 @2gua: 其实,我一直希望哪一天能用Ruby进行数据分析,stats with Ruby......哪一天,哪一天......[doge] [ [微博](http://www.weibo.com/1609119537/Bmt7v95Fn) ]
+
+2014-09-11 问:@付超群 不知道有没有中文发音相似度计算算法或者类库?比如北京 百斤 鼻颈 背景 如果可以顺道比较英文更好,比如peking,beking 答: 关于算法和开源代码整理了一个 #脑图#,问答进展和相关资料在 http://t.cn/Rhf5xio 还收录了一些相关论文(含汉语) 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BmsMAeh0K) ]
+
+2014-09-11 #夜读春秋# GDP与汇率数据是经济、金融研究的基本盘! (数据资源整理: http://t.cn/RhVDKg5 ) 1.世界银行的全球各国GDP(1983-2013)http://t.cn/hFsNY 2. 美联储汇率数据(H.10): http://t.cn/RhVDKgq (1996-2014) 3. 那台北的GDP呢? http://t.cn/RhVgFWl ,http://t.cn/zOMb9mJ [ [微博](http://www.weibo.com/5220650532/Bmpx29PN5) ]
+
+2014-09-10 #NLP# 诸君,"城市规划" 领域词表来了, 还等什么呢? 数据传送门 http://t.cn/RhVVYBk 感谢 @国际城市规划 //@规划中国: //@国际城市规划: 编撰词典对我等难度太大,欢迎有缘人慢慢加入积累 http://t.cn/RhVcLWx //@城规田宝江: 好想法!//@中大袁媛: 可以出版一本专业英语的词典或教材 [ [微博](http://www.weibo.com/5220650532/Bmm8O31VG) ]
+
+2014-09-10 #机器学习# 领域大牛 Michael Jordan 是Andrew Ng的博士导师,擅长 recurrent neural networks , Bayesian nonparametric analysis, probabilistic graphical models, spectral methods, kernel machines 机会难得有问题赶紧上Reddit上问,http://t.cn/aOioBZ [ [微博](http://www.weibo.com/5220650532/Bmm3VbIR5) ]
+
+2014-09-10 问: @chico2011 @leo_lq 求推荐金融交易风险评估方面的文献 答: 资源列表 http://t.cn/RhVqWuZ 金融风险管理领域全局观参见 Financial Institutions Management: A Risk Management Approach (沃顿学院教科书)。量化评估方法(含风险价值 VaR)有2011年综述, 此外咱做了个VaR相关概念的脑图 请补充指正 [ [微博](http://www.weibo.com/5220650532/BmlXxt5hC) ]
+
+2014-09-10 张天雷 《概率编程语言与贝叶斯方法实践》 //@小猴机器人: 来,给个中文介绍哈, http://t.cn/RPwbEPz [ [微博](http://www.weibo.com/5220650532/BmkyPihT4) ]
+
+2014-09-10 加进列表了 pdf传送门 http://t.cn/RhcFi0l //@诸神善待民科组: 图是种方法Method,不是模型 Model,没说到 Bayesian Reasoning and Machine Learning 真是不开心,这比 Koller 的 PGM 好读,好处是图多,我就喜欢看图说话的小二班 [ [微博](http://www.weibo.com/5220650532/BmkxhgVMr) ]
+
+2014-09-10 [资料整理]《Bayesian network与python概率编程实战入门》http://t.cn/RhcnZrY 几个Bayesian network讲义 (其一来自Eric Xing老师的课 Probabilistic Graphical Models), python概率编程实战"Bayesian Methods for Hackers", pyMC短教程,博客系列比较python概率编程工具. 感谢 @王威廉 @西瓜大丸子汤 [ [微博](http://www.weibo.com/5220650532/BmjrJgeI2) ]
+
+2014-09-10 US News 全美大学排名数据集: 新鲜出炉2015年排名前150的综合大学(national university)和文理学院(national liberal art college) . 资源列表 http://t.cn/RhcYKC2 包括1983-2007, 2008, 2009, 2010, 2011-2015 数据,应该比较全了. 欢迎补充 [ [微博](http://www.weibo.com/5220650532/BmizVr1sS) ]
+
+2014-09-10 DBPedia 2014: 458万东西: 144万人, 73万地点, 41万作品(含12万音乐专辑, 8.7万电影,1.9万视频游戏), 24万组织(含5.8万公司,4.9万教育机构), 25万物种等 [ [微博](http://www.weibo.com/5220650532/BmizMhrjB) ]
+
+2014-09-09 http://t.cn/zOpIrjJ 中文语言资源联盟,英文译名Chinese Linguistic Data Consortium,缩写为CLDC, 有少数民族语言,方言数据 //@龙星镖局:有专门放入方言的nlp研究 吗?@白硕SH 老师 //@殆知阁:转发微博 [ [微博](http://www.weibo.com/5220650532/BmcCdeWno) ]
+
+2014-09-09 好东西 ,向 迷渡 justjavac (索引的作者)致敬! 顺路推荐一下他的另一个工作 "Google 全球 IP 地址库" , http://t.cn/RvabGv5 //@justjavac: 我说今天怎么收到好多私信呢,原来根源在这儿啊。//@CSDN_CODE:Mark! [ [微博](http://www.weibo.com/5220650532/BmcoO4bqA) ]
+
+2014-09-09 找到一组相关测试数据集(VAST challenge 2003-现在),基本上就是用户利用可视化工具,根据特定需要分析大规模业务数据,继而推理验证猜想。 例如分析预测恐怖袭击,发现金融犯罪嫌疑人,有一篇总结文章值得一读: http://t.cn/Rhtmw01 [ [微博](http://www.weibo.com/5220650532/BmbO4EuMd) ]
+
+2014-09-09 问: @海中的沙粒 点餐,我想要更多关于可视分析学的资料? 答: 可视分析学(Visual Analytics) 利用可视化方法支持对大规模复杂(科学)数据的人机协同分析推理。问答进展收录: 经典, 综述, 社区, 会议等资源 http://t.cn/Rht6xF8 看附图, 一分钟理解其定位、原理以及跨学科特性。 [ [微博](http://www.weibo.com/5220650532/BmbGkaI7Z) ]
+
+2014-09-09 问:@_绝影_ 求助 刚开始做图像融合相关领域研究,请问有哪些大牛? 答:进展 http://t.cn/RhqD63F 图像融合(Image Fusion)在计算机视觉(computer vision), 遥感(remote sensing)和医学图像(Medical Image)上都有应用,可追踪会议IPCV,ICIFE, 期刊IJCV 及综述。大牛欢迎专家传送 [ [微博](http://www.weibo.com/5220650532/Bm9jvfke6) ]
+
+2014-09-09 转发理由:开放政府数据。另外推荐RPI的 Linking Open Government Data,收录了1800多个数据集,100亿RDF三元组 http://t.cn/RhtMeAj [ [微博](http://www.weibo.com/5220650532/Bm8UryKa7) ]
+
+2014-09-09 #夜读春秋# 最近JWT(JSON Web Token,是一种基于JSON的认证安全协议)势头很火,这里找了一个48页的幻灯片,帮你快速了解这些概念的含义,并提供一定全局观 http://t.cn/Rht40uL 该作者(Brian Campbell)还有一个更新的幻灯片讲JWT和JOSE http://t.cn/Rht40uw [ [微博](http://www.weibo.com/5220650532/Bm6KQB6nM) ]
+
+2014-09-08 @phunter_lau 推荐了 Peter Norvig的regex生成器 http://t.cn/8FGNh2J http://t.cn/8FnLiON @孙明明_SmarterChina 推荐了Bartoli等基于遗传算法的实现 http://t.cn/zlmNYLJ @布尔乔亚之犬 推荐了SO上一个很好的讨论贴 http://t.cn/Rh5H2za [good] [ [微博](http://www.weibo.com/5220650532/Bm2SOaRyu) ]
+
+2014-09-08 黄昌宁 赵海 《中文分词十年回顾 》http://t.cn/Rh5Xe3S //@龙星镖局: 有个 中文分词十年 孙老师搜一下 [ [微博](http://www.weibo.com/5220650532/Bm1jmwaCk) ]
+
+2014-09-07 Tomas Mikolov http://t.cn/Rhq2QVU 很有意思。0.1c版更新等了近九个月,恐怕是跳槽耽误的。他今年5月从Google跳到Facebook, 工作之余还努力维护word2vec开源代码。爱看源代码的可以直接读diff http://t.cn/Rhq2QVZ [ [微博](http://www.weibo.com/5220650532/BlRmn38uo) ]
+
+2014-09-06 问: @V井颠V 对国内中长文章(300~5000字)近似新闻门户网站频道粒度的自动分类,有好的模型方法吗? 答: 进展 http://t.cn/RhGTzfI 考虑 statistical topic model, 推荐UIUC翟成祥 ( http://weibo.com/5220650532/BhWo26Y93 ) , Stanford 和Umass 都有软件包 国内工作欢迎补充 [ [微博](http://www.weibo.com/5220650532/BlMR9kjJ7) ]
+
+2014-09-06 感谢推荐,当然是好东西! //@尘绳聋-SYSU: 那个网站还有个R for big data: http://t.cn/zHXfTF1 之前看人推荐过biglm, bigrf等pkg//@尘绳聋-SYSU: [晕] 传说wiseRF比sklearn里的RF更scale更快,不知道是不是真的[威武] [ [微博](http://www.weibo.com/5220650532/BlMJyCoRe) ]
+
+2014-09-06 非常感谢,这本书是亚马逊的Computer Vision类畅销书第一名 卡片盒子添加了新链接 //@维尔茨:对于计算机视觉/图像强烈推荐Szeliski的Computer Vision: Algorithms and Applications。传送门:http://t.cn/RhbF7jr好东西传送门: 不好意思,你是找第二版吗? 可以问问 @没有我找不到的电子书 [ [微博](http://www.weibo.com/5220650532/BlIbspyg8) ]
+
+2014-09-06 回复@ustczen: 感谢传送好东西。这是新加坡国立 Min-Yen Kan (靳民彦) 教授 研究组的工作 http://t.cn/SwJHvL @52nlp 2011年转过他们短信捐赠请求 http://t.cn/RhbDbIV //@ustczen:回复@好东西传送门:所以我老年痴呆又犯了么。。附链接:http://t.cn/hrXXWz [ [微博](http://www.weibo.com/5220650532/BlHNqyCgt) ]
+
+2014-09-06 问:@龙星镖局 如果要从零学习图像或语音分析,要从那几本书开始? 答: 问答进展 http://t.cn/Rhbeix0 网络问答结果和相关课程大多推荐这几本经典老教科书:Digital Image Processing (3rd Edition) (2007), Speech and Language Processing, 2nd Edition (2008), 卡片盒子: http://t.cn/Rhbeixp [ [微博](http://www.weibo.com/5220650532/BlHHF1jr2) ]
+
+2014-09-06 [开放数据]印尼政府开放数据 data.ukp.go.id http://t.cn/Rhbrjfv 于2014-09-05上线,有700 多数据集。要使用数据恐怕先要能读懂印尼语(拼写属于拉丁语系,最早源于荷兰语)。此外,2014统计数据表明印尼有2.5亿人,是排名世界人口第四大国。 [ [微博](http://www.weibo.com/5220650532/BlHkREGAC) ]
+
+2014-09-06 监控页面变化的开源项目page-monitor 传送理由: github上的好东西,快800星了。 作者的博客也很有深度,而且竟然用issue tracker写博客,赞! 这是个例子 http://t.cn/8s35KgP [ [微博](http://www.weibo.com/5220650532/BlH9sz9H9) ]
+
+2014-09-06 问:@三鹿无毒奶粉 请问贵博关于航班准时预测和机票价格预测有那些相关的论文和模型 答:问答进展 http://t.cn/RhbBwy9 不少人用回归模型 航班准时预测(flight delay):有几篇MIT的文章;机票价格预测(ticket price): 有不少专利(发明人包括USC Craig Knoblock 教授) 卡片盒子 http://t.cn/RhbBwyK [ [微博](http://www.weibo.com/5220650532/BlH4Tc57x) ]
+
+2014-09-06 传送理由:右边的链接真是好东西 -- 不止配色工具,还有大量字体,图片、纹理,壁纸等众多素材资源网站一网打尽。 //@设定控: 配色工具网站汇总 http://t.cn/RPbMz7M [ [微博](http://www.weibo.com/5220650532/BlGYiyx88) ]
+
+2014-09-06 问: @ShawnAtLoss 请问哪边可以找到比较全面的关于大数据的survey 答: 问答进展: http://t.cn/Rhb1b0Z 推荐两类阅读:1 大数据领域地图,覆盖相关 技术,应用,公司 等 2. github好资源合集 http://t.cn/Rhb1b0w 1K+星,上百链接. 卡片盒子(现有6个资源): http://t.cn/Rhb1b0A 欢迎补充 [ [微博](http://www.weibo.com/5220650532/BlGU6teFP) ]
+
+2014-09-06 [推荐] 一张很好的脑图胜过千言万语,帮助你获得python的大数据处理工具全局观。http://t.cn/Rhb3P8I [ [微博](http://www.weibo.com/5220650532/BlGE7oFdz) ]
+
+2014-09-05 转发理由:非常酷的星系生死大片!本超星系团呈羽毛形状,因为有个巨大的吸引子(就是羽毛的中心),不断吞噬星系。这些“羽毛”的绒线就是星系赴死即将遵循的轨迹。在图中银河系只是微不足道的一个小点 [ [微博](http://www.weibo.com/5220650532/BlzOYbTRu) ]
+
+2014-09-05 //@ShangguanRPI: 在前东家也做过一样的数据分析,结论也几乎一致。用的数据集来自usps登记的过去10年所有地址更换记录,不确定census的数据是否也来自这个源。 [ [微博](http://www.weibo.com/5220650532/BlzHefKoa) ]
+
+2014-09-05 转发理由:世界基本经济数据的可视化,地图均给出了数据出处 [ [微博](http://www.weibo.com/5220650532/BlzmDai0F) ]
+
+2014-09-05 美国著名房地产公司trulia近日利用政府开放数据 http://t.cn/Rh4Htwl 分析了近年美国人口迁移的倾向:就近,房价低,人口密度小,低失业率 http://t.cn/Rh4HtwO [ [微博](http://www.weibo.com/5220650532/BlyKPBSIT) ]
+
+2014-09-05 http://t.cn/Rh4W25z 今年欧洲python大会的一个35页在线讲义幻灯片,用实例介绍如何用python实现概率编程,尤其是pymc3 阅读时间大约半小时 [ [微博](http://www.weibo.com/5220650532/Blyi3aVGF) ]
+
+2014-09-05 [问题求传送] 问:@开机就好ing 有没有比较好的Gbrank的相关的开源实现 答:就是 Zhaohui Zheng SIGIR '07 文章“A regression framework for learning ranking ...” 里提到的GBRank (guardian boosted) 问答进展看 http://t.cn/Rh4C8hd 初步好像有一个C++ 开源代码 http://t.cn/Rh4C8hg 欢迎补充 [ [微博](http://www.weibo.com/5220650532/BlxKpwU1D) ]
+
+2014-09-04 [资料整理] PDF版 http://t.cn/RhUOt6p 《智能问答系统:心得点评与文献列表》覆盖几个知名的问答系统:Halo (Aura); Siri;IBM Watson (DeepQA); True Knowledge;Facebook Graph Search 重点评论了知识图谱和语义web技术在自动智能问答系统中的应用与前景 [ [微博](http://www.weibo.com/5220650532/BlqyBe19Z) ]
+
+2014-09-04 旧闻回顾: Siri开发者成立人工智能公司Viv Labs (注意 网址是 viv.ai ), 花两年时间开发了能自动学习的智能个人助理系统Viv:将自然语言表达的复杂问题与搜索结合 相关Wired报导( http://t.cn/RhUtTwq 8月12日) 有微博原发评论 @网路冷眼 @新浪科技 (看 @张栋_机器学习 评论) http://t.cn/RhUtTw5 [ [微博](http://www.weibo.com/5220650532/BloN1gTeu) ]
+
+2014-09-04 问: @simba0626 请问现今有哪些成功的智能问答系统? 答: 问答进展 http://t.cn/RhUq00L 成功不好定义,基本用了知识图谱, 例如 IBM DeepQA (watson), wolfram alpha, Apple Siri, Google now。当然学术界也有一群人在做开放领域的图灵测试,如Eugen http://t.cn/RhUq00y 相关文献待会整理个资源合集 [ [微博](http://www.weibo.com/5220650532/BloyuzoCh) ]
+
+2014-09-03 回复@统计之都: 非常感谢 这可是今年7月新鲜出炉的文章,Gilles Louppe http://t.cn/RhyvpGz //@统计之都:Gilles Louppe的博士论文《随机森林:从理论到实践》,PDF下载地址http://t.cn/RP8JQyC。 [ [微博](http://www.weibo.com/5220650532/BlfvG3fm9) ]
+
+2014-09-03 问: @董伟_dzw259 哪里能够找到比较详细介绍随机森林的paper吗? 答: http://t.cn/RhLFi4R 随机森林(random forests)原作者之一 Leo Breiman 在“机器学习”2001年期刊有长文。推荐哥伦比亚大学教授Lauren Hannah的讲义。中文 @LeftNotEasy 2011年博文. 资料卡片: http://t.cn/RhLFzN1 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/Blfhkk0qI) ]
+
+2014-09-03 问:@子_相 求推荐一个PHP上的内存cache 的mod 答: http://t.cn/RhLeSxQ APC曾是首选(towser451@github 也推荐), 但php5.5用opcache作bytecode cache后, APC user data cache就被删改成APCu。@Laruence (APC, opcache的lead)2013博文指出APC效率问题,并因此开发YAC。卡片盒子: http://t.cn/RhLeSx8 [ [微博](http://www.weibo.com/5220650532/BleQ8wKSv) ]
+
+2014-09-03 在Neural Networks and Deep Learning第四章有对这个定理的可视化阐述,简洁易懂 http://t.cn/RhL8X74 该书我们以前在深度学习系列里也推荐过 http://t.cn/RhLmjtj [ [微博](http://www.weibo.com/5220650532/BlcZI7vdh) ]
+
+2014-09-01 转发理由:Larochelle是加拿大Université de Sherbrooke的教授。他是蒙特利尔大学Yoshua Bengio的博士,多伦多大学Geoffrey Hinton的博士后,师承深度学习的两大重镇 [ [微博](http://www.weibo.com/5220650532/BkVuU0EdN) ]
+
+2014-09-01 传送原因:用SQL访问Elasticsearch大大方便了查询构造。以前有类似项目ELSeQL, 但已很久没有更新了 @温少 @elasticsearch @Medcl [ [微博](http://www.weibo.com/5220650532/BkU1JcW8K) ]
+
+2014-08-31 传送理由:开源的推荐系统,从各种语言调用都方便 [ [微博](http://www.weibo.com/5220650532/BkOEij8Pb) ]
+
+2014-08-31 @Copper_PKU 的讲义前段时间推荐过,这个也很赞。 [ [微博](http://www.weibo.com/5220650532/BkOCelqIv) ]
+
+2014-08-31 传送问题,问答进展 http://t.cn/Rhw4h2m 看过YAC吗? http://t.cn/zYrnBVx [ [微博](http://www.weibo.com/5220650532/BkK3q8zJ6) ]
+
+2014-08-30 增补两个相关组织: @九章算法 的专业培训可(程序员的新东方)http://t.cn/RhwAzyN 。 @灵魂机器 组织的程序员北美求职 (肉身翻墙)http://t.cn/RhwAzyp len(卡片盒子)=8 [ [微博](http://www.weibo.com/5220650532/BkJlm0cyz) ]
+
+2014-08-30 半夜推荐 Leetcode 资源整理合集。 它目前有150道题,是程序员肉身翻墙的好东西,也适合快速提高自我修养。精选资料在我的卡片盒子里 http://t.cn/RhwwCGL 现在有6项: @灵魂机器 (Frank Dai) 的刷题宝典,若干人的涮题体验。这是一个会成长的卡片盒子,欢迎添加好东西。 [ [微博](http://www.weibo.com/5220650532/BkJheojHW) ]
+
+
+2014-08-30 SAS base 今年KDnudgget数据分析常用工具民意调查( http://t.cn/RhZ0HjY )排名第9,而排名靠前的都有免费版。现在SAS推这个免费版,很好奇它明年的排名 //@刘政-SAS: 回复@侯广_充电ing:大学免费版跟我要,有base, graph, miner, or, 计量经济学和时间序列。//@侯广_充电ing:全国数学建模马上就要开始 [ [微博](http://www.weibo.com/5220650532/BkFytfb9v) ]
+
+2014-08-30 问: @小磊_DM_中二青年 在学搜索,请问有Nutch的相关资料吗? 答: nutch主要做网络爬虫,可以和solr结合做搜索引擎。问答进展: http://t.cn/RhZN72R (卡片盒子 http://t.cn/RhZN72E 6个资源): nutch 的中英文安装短教程(此外看Nutch wiki); nutch工作流程; 最近很火的CommonCrawl也转用nutch [ [微博](http://www.weibo.com/5220650532/BkFg8v2lw) ]
+
+2014-08-30 回复@icanswimwell: 美国的数据前几天才发过 http://t.cn/RhZJNoM (卡片盒子现有19项 http://t.cn/RhZJNox ) 美国政府在data.gov开放了十多万个免费、免版权的公开数据集 //@icanswimwell:感谢分享~~要有美国的就更好啦[挖鼻屎][挖鼻屎] [ [微博](http://www.weibo.com/5220650532/BkEg1kOpm) ]
+
+2014-08-30 回复@山雨清新: 原帖就是一个卡片盒子,链接可以在那里找到,现在已经16项了。同附链接 (200k book,1M rating)书籍 http://t.cn/RhZMPWc (10k movie, 10M rating)电影 http://t.cn/RhZMPWt //@山雨清新:请问新增补的两个评论数据集的链接? 找了下,没找到 //@好东西传送门:回复@好东西传送 [ [微博](http://www.weibo.com/5220650532/BkDZfdlu2) ]
+
+2014-08-30 回复@好东西传送门: 又增补了两个评论数据集: (10k movie, 10M rating)电影; (200k book,1M rating)书籍 //@好东西传送门:回复@海中的沙粒: 感谢提醒,这一次主要是针对该问题的资源整理,目前列表里原来有12项,现在有增补了CMU的ClueWeb2009网页数据集(10亿页),NIST TREC的测试数据 [ [微博](http://www.weibo.com/5220650532/BkDzbsk24) ]
+
+2014-08-30 [资料整理] @鱼片的小露宝 我正在学习hadoop,我想知道从哪里可以获取一些原始数据样本(就好像hadoop权威指南里面所说的NCDC的气象数据日志)来做数据分析的练习? 答: 一些大数据与目录: http://t.cn/RhZqcq9 气象遥感数据因有图片通常比较大;政府数据包罗万象;(社交)网络数据边多。 [ [微博](http://www.weibo.com/5220650532/BkD1Yu1WE) ]
+
+2014-08-30 [数据资源] 日本政治、经济、地理数据大全(免费,可下载)http://t.cn/RhZb561 日本开放政府数据网站测试版(www.data.gov.jp)于2014年发布,现有来自21个政府部门的10,411个数据集。 其他数据源:历年人口、工业、经济普查数据; 政府预算数据; 地理信息数据;1947-2003议会选举数据 等 [ [微博](http://www.weibo.com/5220650532/BkCwfoJ0Y) ]
+
+2014-08-29 [好文略读|机器学习] Big data opportunities and challenges: Discussions from data analytics perspectives (综述,@南大周志华 等著)http://t.cn/Rh7IH66 感谢推荐人 @刘知远THU @RAYMOND__WU 等 [ [微博](http://www.weibo.com/5220650532/BkuQ30GSA) ]
+
+2014-08-29 Google2014 KDD 的文章,讲他们自动知识图谱提取项目Knowledge Vault的最新进展,比较了人肉众包生成的知识图谱(dbpedia, freebase,...): http://t.cn/RhhjLVe Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion [ [微博](http://www.weibo.com/5220650532/Bkt39dyDU) ]
+
+2014-08-28 问: @钱知易: 能不能帮我找找大规模图像检索方面的资料以及这个领域的牛人(国内国外)? 答: 初步结果:http://t.cn/RPe5HBt 中科大 杨晓冬有一个很全面的计算机视觉领域资料整理。兰晓松 在科学网上著有专家列表,2014年9月自动化所有一个“计算机视觉前沿研讨会” ,列举了许多国内著名专家 [ [微博](http://www.weibo.com/5220650532/BklQZALi7) ]
+
+2014-08-28 问: @Don0719 有没有做正电子无损检测的大佬或者相关的书籍、文献啊? 答: 欢迎材料学问题。 问答进展看这里 http://t.cn/RPsI3yE 推荐R. Krause Rehberg 2010年的幻灯片。正电子湮没研究论文很多,还有专门国际会议。无损检测相关找到6篇。欢迎专家补充指正。 [ [微博](http://www.weibo.com/5220650532/BklhZul43) ]
+
+2014-08-27 问:@月光馆果果妈 请问从语音和视频资源共同进行学习的算法谁比较有研究啊 答: 深度学习是当前趋势(斯坦福,微软,谷歌都这样)。专家 Andrew Ng, Geoffrey Hinton, Li Deng, Louis-Philippe Morency, Ruslan Salakhutdinov, 微博技术控:@言语挖挖 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BkdhGpY4d) ]
+
+2014-08-27 传送一个关于学术笑话: 论文评审分两类,一种呢是评审截止日期早就过了,另一种是还没过期的。“There are two types of manuscript reviews. Those that are overdue, and those that are not overdue yet.” 如果看数据分布的话,估计最常见的是“明天就是评审截止日了,咋一篇都没审呢?” [ [微博](http://www.weibo.com/5220650532/BkctZ33Iu) ]
+
+2014-08-27 非常感谢 @董力at北航 他本科时候做的一个KDD2012demo http://t.cn/RPDwF8S (情感细分为厌恶、愤怒、高兴、悲伤四类 )很好玩,分析各省人民的情绪彼岸花,小心地图炮呦?能下载数据。 此外他以前还推荐过 http://t.cn/Sc68lv Sentiment Symposium Tutorial [ [微博](http://www.weibo.com/5220650532/Bkco7lkJU) ]
+
+2014-08-27 非常感谢 @posa88 推荐 lingpipe的影评数据(基于IMDB)由康奈尔的 Lillian Lee 和 Bo Pang 提供 //@posa88:大连理工这个库用过,还行:http://t.cn/RPesat2 ,http://t.cn/bln2a [ [微博](http://www.weibo.com/5220650532/BkcgExrKL) ]
+
+2014-08-27 问: @蒋宁平 求推荐中文情感计算资源,包括中文情感词库,尤其是细分情感种类的(比如喜爱,愤怒,悲伤…等)。 答:问答进展:http://t.cn/RPeutqb 初步答案:斯坦福有公开课和基于深度学习的成果。知乎有资源列表。刘兵教授有综述。数据看 NTUSD, 知网。微博问 @TT小和子 @黠之大者 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BkbzO54pR) ]
+
+2014-08-27 回复@DataMooc: 有相关问答,整理中,参见 http://t.cn/RPmIw2I //@DataMooc:有没有Python版的中文分词开源工具? //@好东西传送门:搭车再次推荐ansj, 孙健写的很有用的中文分词工具。http://weibo.com/5220650532/Bh9WGeljD //@ansj: 应该不是[衰] //@好东西传送门:@夏二货爱吃 [ [微博](http://www.weibo.com/5220650532/Bkb1stYmh) ]
+
+2014-08-27 搭车再次推荐ansj, 孙健写的很有用的中文分词工具。http://weibo.com/5220650532/Bh9WGeljD //@ansj: 应该不是[衰] //@好东西传送门:@夏二货爱吃胡萝卜: 万恶的微软官网居然用自动翻译!是孙剑 //@夏二货爱吃胡萝卜:@图像视觉研究:的确是说错了。是孙剑。 //@严浩RB:这个孙健是写ansj的那个吗? [ [微博](http://www.weibo.com/5220650532/Bk8kLotLu) ]
+
+2014-08-26 问:@pkuxkxjason 求推荐靠谱的自动摘要软件/服务。特别是针对科技类内容的。答: 问题进展 http://t.cn/RPg0Dkn 两个quora回答但实用工具可靠性低。还要请 @算文解字 指点迷津,他说过 “单文档summerization不是被snippet判死刑了么?” 找到相关文章 http://t.cn/RPg0DkH [ [微博](http://www.weibo.com/5220650532/Bk4hHahVS) ]
+
+2014-08-26 问答进展:http://t.cn/RPgpH65 有不少IEEE Fellow, 华人还有 UIUC马毅(现在上海) 微软亚洲研究院:孙健 。到CVPR, ICCV上多看看能找到不少当打的大小牛 [ [微博](http://www.weibo.com/5220650532/Bk4aUlKJi) ]
+
+2014-08-26 问: @杨洋MQ Social Network 中 Spammer Detection 方面 都有哪些 中文、英文的数据集?答: 初步回答:http://t.cn/RPgtKAl 公开的大多是email,中文较老有2006 TREC , 2005 CCERT;英文有Twitter数据集和Spammer列表。近年未公开:Berkeley, ASU有Twitter研究; 国内要联系上交大。求更多链接 [ [微博](http://www.weibo.com/5220650532/Bk2BaFaY2) ]
+
+2014-08-25 //@昊奋: 这个之前通过@好东西传送门 介绍知识图谱时,介绍过这个probabilistic kb。其实离真正大规模可用还有很长路要走。所谓的可信大部分可在freebase中找到,也就是说freebase的质量和规模决定了很多 [ [微博](http://www.weibo.com/5220650532/BjVr9tH7z) ]
+
+2014-08-25 //@velvel2: 1)首位华人AAAI fellow杨强博士研究转移学习很多年了。多任务学习是其中一种 http://t.cn/aepeZn 2)Bengio的深度学习新书有一章也是关于转移学习和多任务学习的 http://t.cn/RPdxFds [ [微博](http://www.weibo.com/5220650532/BjVr0j8uQ) ]
+
+2014-08-24 回复@phunter_lau: 感谢有爱心的专家 传送理由: 面试官的面经 //@phunter_lau:回复@好东西传送门:复制粘贴一下“我都是国外面经,都是谈谈你之前做过啥,你就做过啥讲了就行了。我们一般不测试面试人什么问题,默认他简历上说的都是真实的,然后拿几个实际问题看看他的看法和解决方向如何就基本上知道 [ [微博](http://www.weibo.com/5220650532/BjLGK2IJe) ]
+
+2014-08-24 问: @尘绳聋-SYSU 大大ML面经来一发?急需 答:假设需要的是软件工程师求职,寻找机器学习(machine learning)面经。建议多看题,把自己的知识强化。很多问答系统都有常见面试问题列表, 初步有 reddit, stackoverflow, quora, 知乎 等。问答进展: http://t.cn/RPB1Sxf 欢迎补充指正,尤其是具体面经 [ [微博](http://www.weibo.com/5220650532/BjLqu8Kw0) ]
+
+2014-08-24 回复@AixinSG: 多谢补充,NUS 在这方面做的很不错,链接传送 http://t.cn/RPB3zgO 还有一篇相关的是 Addressing cold-start in app recommendation: latent user models constructed from twitter followers //@AixinSG:SIGIR14 有一篇 New and Improved: Modeling Versions to Improve App Recom [ [微博](http://www.weibo.com/5220650532/BjLil85H7) ]
+
+2014-08-24 问: @应豪超 :有关于手机app推荐的文章吗 答: 就是找论文,关键词 Recommender Systems that Suggest Mobile Applications 。 初步结果 找到一个2011年移动推荐讨论班的幻灯片(领域综述),一篇IUI2013 (列举feature), 一篇SIGIR 2013, 还有若干相关, 问答进展: http://t.cn/RPBuvdZ 欢迎指正补充 [ [微博](http://www.weibo.com/5220650532/BjLc4frgA) ]
+
+2014-08-24 传送理由:清晰的解题思路。补充一下,Haijie Gu 是GraphLab的联合创始人,现在CMU读博士。GraphLab 2013年融资6百多万美元。 (原文格式更好看一些,http://t.cn/RPBR5pm) [ [微博](http://www.weibo.com/5220650532/BjKQej5rE) ]
+
+2014-08-24 转发理由: 你懂的 //@何_登成: //@传媒老跟班:@设定控 做过一个谷歌专题 http://t.cn/RvnDzSG ,提供了多种访问谷歌的方式,大家可以看看。尤其推荐其中提到的#美国在线# http://t.cn/hVO8E ,该站搜索结果就是谷歌的结果,速度很快。 [ [微博](http://www.weibo.com/5220650532/BjKjCjeBa) ]
+
+2014-08-24 回复@MD_1stUP锐之翼: 全是野生的,所有物种活动活动观察记录网上都有,这是一条荷兰阿姆斯特丹的观察记录: http://t.cn/RPB5AWt 超市里只卖养殖的,野生的恐怕只能依律就地销毁 //@MD_1stUP锐之翼:是入侵华人超市吧[哼] [ [微博](http://www.weibo.com/5220650532/BjHn5uCyE) ]
+
+2014-08-24 问: @十月伤感wb 可否推荐些基于社交网络的推荐算法的资料,以及数据集,特别是数据集的下载地址谢谢了做推荐的很多都需要 答: [初步传送] 关于数据集: 斯坦福大规模网络数据集大全 (SNAP) http://t.cn/RPBqrcJ 关于推荐系统:看这里 http://t.cn/RPBqrci 问答进展: http://t.cn/RPBqrc6 求指点 [ [微博](http://www.weibo.com/5220650532/BjHkmuGpo) ]
+
+2014-08-24 @斯库里 传送理由:为广泛传播的社交媒体消息提供严谨的科学依据 http://weibo.com/1820578701/Be7W6AouY [ [微博](http://www.weibo.com/5220650532/BjHe7o3sj) ]
+
+2014-08-24 大闸蟹来了。近年来全国满街都是阳澄湖大闸蟹的招牌,可你知道吗,大闸蟹也正在入侵欧美呢! 早上查了全球生物多样性信息库(GBIF, 5亿条带GPS定位的物种活动记录), Eriocheir sinensis (Chinese mitten crab)找到3400+记录: 分布在欧洲沿海,北美东部与五大湖区。当然, 阳澄湖不算 http://t.cn/RPBGJ8y [ [微博](http://www.weibo.com/5220650532/BjH4ksrJq) ]
+
+2014-08-24 网站上的数据早已分门别类整理好了,生物学者都可以直接查询使用。待会整个关于大闸蟹的 //@珏黛佳人GenderIT: WOW //@玛酷嘟纳噜多昕之张: 怎麼處理這些數據..? //@黠之大者://@浙大陈为: //@好东西传送门: 在论文后面的507,825,517 (5亿) 条免费开放的带GPS坐标的全球物种观察记录才是关键 [ [微博](http://www.weibo.com/5220650532/BjGVc2pNI) ]
+
+2014-08-23 说起松鼠,就想起著名的 @科学松鼠会 这里的松鼠其实只是一个引子,在论文后面的507,825,517 (5亿) 条免费开放的带GPS坐标的全球物种观察记录才是关键,用到数据的800篇论文证明了数据的重要价值,值得传播 //@Coder_Chenzhi: 还是红松鼠好看,一直对云大的灰松鼠无感,总感觉灰松鼠的尾巴像锅刷。。 [ [微博](http://www.weibo.com/5220650532/BjBpWuJFO) ]
+
+2014-08-23 问:@七哥爱吃山楂片 能帮忙收集一下,国内外机器学习领域大牛的主页吗? 答:这是一个不完整的名单,仅限于美国 http://t.cn/RP1Pp3s (资料卡片:http://t.cn/RP1Pp1v )有不少资深院士级大拿,也有冉冉升起的助理教授。一家之言,欢迎补充指正。 图推中国教授 [ [微博](http://www.weibo.com/5220650532/Bjzxm9LTz) ]
+
+2014-08-23 可爱的灰松鼠竟然是入侵者, 占领了土著红松鼠的家园!如何估测外来物种与土著物种的分布范围呢?全球生物多样性信息库(GBIF)已为1百多万物种建立了5亿条活动记录, 此开放数据被800余专业论文使用。某论文用大量松鼠活动记录, 分析出气候因素与分布范围的相关性。GBIF资料: http://t.cn/RP3FuVI [ [微博](http://www.weibo.com/5220650532/BjzcTAdjn) ]
+
+2014-08-22 问: @蓝莲斯基:有没有关于uplift建模的资料? 最好先是具体案例,然后是论文讲解,希望能看到近来综述总结的论文 答:增量建模(uplift)可用来寻找“可说服”的人群,属于市场推广。找到 一些关于美国的银行的用例,还有保险业中的应用论文。初步问答进展 http://t.cn/RP3A4IC ,欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/Bjtl15SUk) ]
+
+2014-08-22 问: @AOzil 计算广告学的基本问题,如何以最小的代价,去评估一个媒体或是交易所的流量是否有价值?现在做法是各种投放,发现成本较高。 答: riverliu81 "以最小的代价去评估一个广告渠道为投放者带来的价值", copy成熟竞争对手; 小成本投放, 比较转化率; 电子邮件为王。问答进展 http://t.cn/RP3wGuN [ [微博](http://www.weibo.com/5220650532/BjtgulxuW) ]
+
+2014-08-22 [资料整理] 分段线性模型资料与软件 -- 入门篇 http://t.cn/RP3zJLu (cardbox http://t.cn/RP3zJL1 两个基本教程,一个进阶教程;各种编程语言的例子Mathematica, SAS, Matlab, R, python, RapidMinder 关键词: Piecewise linear regression 贡献者: @视觉动物晴木明川 @heavenfireray @禅系一之花 [ [微博](http://www.weibo.com/5220650532/Bjt7Oy7lt) ]
+
+2014-08-22 基于维基百科的统计:用一张地图把各国家/地区同与其相关的英文单词关联起来 http://t.cn/RPuKQqo 中国是dynasty和china。有好几个国家都是“World”: 英国,法国、德国还有日本。 越南倒是和French连上了,很有喜感。 [ [微博](http://www.weibo.com/5220650532/BjqGFkQTm) ]
+
+2014-08-21 [求传送] @isnowfy 问一下有没有免费的能用的中文的分词,标注,树库的数据呢,好多数据一个是不能免费获取,做为爱好者不知道哪里能得到数据自己来搞搞呢。初步线索:分词参@ansj 的推荐 http://t.cn/RPmMfFk 和@刘邵博 的词库 http://t.cn/RPmMfFD 免费中文树库求推荐 [ [微博](http://www.weibo.com/5220650532/BjjvY9yPu) ]
+
+2014-08-21 小知识:电影海报里最常用的颜色是橙色和蓝色 。MoviePosterDB里有最全的电影海报数据库 http://t.cn/hqtlge 想想拿它能做什么有趣的应用吧? [ [微博](http://www.weibo.com/5220650532/BjiJE9Nku) ]
+
+2014-08-21 问:@chico2011 @leo_lq 求推荐金融交易风险评估方面的paper 答: 找到 Financial Engineering and Risk Management Part I (Columbia University on Coursera),但风险评估相关的只简单的介绍了一下VaR。还找到bitcoin和real estate相关论文 问答进展: http://t.cn/RPn8foN 求进一步传送 [ [微博](http://www.weibo.com/5220650532/BjgMzsOJi) ]
+
+2014-08-21 [资源整理] MultiTask Learning资源合集 http://t.cn/RPnTjps 2014KDD最佳博士论文提名, WSDM2014最佳论文, 及与深度学习的结合。传送来自微博的优秀中文评论 @唐小sin @王威廉 @黄厝海滨 @李航博士 @李沐M@Copper_PKU @复旦李斌 @eeyangc @李晗littlefool @李亚超NLP @lby9 http://t.cn/RPnTj0v [ [微博](http://www.weibo.com/5220650532/Bjgysd9gF) ]
+
+2014-08-21 [资源整理]MultiTask Learning 资源合集。传送:#SIGKDD#2014最佳博士论文提名,#WSDM2014# 最佳论文,#ICML#2008 经典论文,以及如何与深度学习的结合。并传送大量优秀中文评论 @唐小sin @王威廉 @黄厝海滨 @李航博士 @李沐M@Copper_PKU @复旦李斌 @eeyangc @李晗littlefool @李亚超NLP @lby9 [ [微博](http://www.weibo.com/5220650532/BjgwRvPbW) ]
+
+2014-08-21 问:@理想主义de患者 有没有音视频流媒体方面的资料啊? 例如g729, g726 答:找到博达(broadcom)的对比贴(Codec Comparision) 问答进展: http://t.cn/RPnYhXO ....... 传送第一站完成,求大家帮忙继续传送,门也会继续帮助把问题澄清。 [ [微博](http://www.weibo.com/5220650532/Bjgoro55J) ]
+
+2014-08-21 问: (微信用户) 谁能推荐一个免费的网上会议系统(国内也能连的)? webex什么都要收费 答: 朋友推荐: uberconference, freeconferencecall,Moxtra。hackernews 推荐五个。看看开源 BigBlueButton http://t.cn/RPnWKl6。此外 bluejeans视频会议很牛但很贵。问答记录:http://t.cn/RPnWKlX 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/Bjg6j2sTY) ]
+
+2014-08-20 问: @sxhfut 能否推荐一下英文论文的学术不端检测系统或网站,免费的或者收费的靠谱的 答: 关键词Plagiarism, 初步答案与进展: http://t.cn/RPn5uwR Turnitin收费,有很多学校用户; Viper 有免费windows单机版; Plagium 免费在线不限长度, 上了两个排行榜,可以同时用几个交叉检测。欢迎补充指正。 [ [微博](http://www.weibo.com/5220650532/Bjdaxhu6s) ]
+
+2014-08-20 http://t.cn/RPEIus6 "Brewing Deep Networks With Caffe" 补一个他前段时间在CVPR关于Caffe的讲座 //@我爱机器学习: Caffe作者,学习 [ [微博](http://www.weibo.com/5220650532/Bj90I5mWA) ]
+
+2014-08-20 图片一向是知识产权斗争中的一个重要领域,英国的GettyImage 提供免费图片引用服务 http://t.cn/RPELwwS "You can embed a Getty Images photo on a website, social media site or blog for free and without having to buy a licence, as long as the photo is not used for commercial purposes" [ [微博](http://www.weibo.com/5220650532/Bj88Q5yfS) ]
+
+2014-08-20 谢谢补充 The repository has been designed in 2009 by Reza Zafarani and Huan Liu. Huan Liu 是ASU的资深教授,各种院士 AAAI, ACM (Distinguished Scientist), AAAS, ASEE, IEEE (Fellow), SIAM; http://t.cn/zHsb5qk 回复 @唐小sin:http://t.cn/zjBLh8P ASU的一些数据,貌似还有豆瓣的 //@好东西 [ [微博](http://www.weibo.com/5220650532/Bj819a13Z) ]
+
+2014-08-20 这是一个学术讨论贴,@郑梓豪爱文艺 在这里 http://t.cn/RPRegxF 更详细地描述了他遇到的研究问题,和初步想法,很希望能得到指点,并且与同学们讨论研究。先代他谢过了。 [ [微博](http://www.weibo.com/5220650532/Bj7IFeAHf) ]
+
+2014-08-20 回复@CodeColorist: 非常感谢,这个数据集非常好 http://t.cn/RPEhoMR “Collection and sharing of data for scientific analysis of Internet traffic, topology, routing, performance, and security-related events” 适合科研 //@CodeColorist:这个项目里自治系统(ASN)的数据是20 [ [微博](http://www.weibo.com/5220650532/Bj7HbCJiI) ]
+
+2014-08-20 问: @andeguangshaqianwanjian 传送门啊,有python做神经网络(时间序列预测方面)的资料没 答: 准备一些入门知识 http://t.cn/RPRFdBG 基于神经网络的方案:试试Pandas; Github上有 theano-rnn 开源演示; 常规python时间序列分析 可以用scikit timeseries; 此外还有一些背景知识供你参考。 [ [微博](http://www.weibo.com/5220650532/Bj7qMhxSx) ]
+
+2014-08-20 [求指点] @郑梓豪爱文艺 网络媒体上发现热门话题的方法,如何在一个小「话题」,比如「机器学习」中发现新动态。 我想改进现有的热度函数heat算法,例如采用新参数(讨论者属性的混乱程度), 或分析用户行为在时间轴上的异常分布。 问题进展: http://t.cn/RPRegxF 找到的一些相关文献, 但都比较旧 [ [微博](http://www.weibo.com/5220650532/Bj7aZ0hZj) ]
+
+2014-08-20 斯坦福大规模网络数据集大全(Stanford Large Network Dataset Collection, SNAP) http://t.cn/RPRgvZQ 由斯坦福教授Jure Leskovec整理。免费,清理过,可下载。十多种不同类型的网络数据集(社交;在线社区;电子邮件;引用;Web, ...)。 Friendster数据集有6千5百万节点,18亿条边。 [ [微博](http://www.weibo.com/5220650532/Bj6Zvszak) ]
+
+2014-08-20 [资源整理] 提高网站页面响应速度的解决方案 http://t.cn/RPRrPLn : 最简单用DNS A-Record, 反向代理及负载均衡 可以先考虑ngix, 进一步可用proxy分流 感谢贡献者: mahak(github), @BUPTGuo , @情非得已小屋, @新世界_玉兔 , @52cs [ [微博](http://www.weibo.com/5220650532/Bj6Lajkko) ]
+
+2014-08-20 [推荐] Google研究员贾扬清 @fs_Yangqing 分享GoogLeNet在2014大规模视觉识别挑战赛的经验(Large Scale Visual Recognition Challenge 2014)。"个人觉得,更有意思的是 how to get the number 而不是 what the number is。我从classification和detection两个track分别聊一下" http://t.cn/RPR1pLX [ [微博](http://www.weibo.com/5220650532/Bj6zoraCR) ]
+
+2014-08-20 [续求助] 问: @杜威Dewey 比较 nextenta、nutanix? 答: 讨论与进展 http://t.cn/RPRunNs 有一篇不错的谷歌话题热度分析: http://t.cn/RPR3wtD 1.nutanix 与nextenta分类不同, 前者是 Boxed Storage, 后者是 Software-only Storage; 2.nutanix在增长,也有很多对手, nextenta 在下降, 仍占绝对优势 [ [微博](http://www.weibo.com/5220650532/Bj6ntaatp) ]
+
+2014-08-20 [求助] 问: @杜威Dewey 互联网应用的分布式数据库存储使用网络存储有什么好方案吗?相对于昂贵的FC-SAN,性能一般的NAS,IP-SAN是不是比较好的选择。Nexenta、OpenFiler这些开源软件能上生产环境吗?有人说nextenta不合适用于互联网架构,说nutanix不错, 怎么看? 讨论与进展: http://t.cn/RPRunNs [ [微博](http://www.weibo.com/5220650532/Bj6kAEAn4) ]
+
+2014-08-20 [知识]"星系动物园"(GalaxyZoo, http://t.cn/RPRnHTO )是邀请公众协助在网络上为上百万个星系在线上进行分类的天文学计划。2007年上线, 第一版两年分类了90万星系,免费数据下载 http://t.cn/RPRnHTl ; 2014 Kaggle Galaxy Zoo challenge头名用深度学习自动分类(RMSE 0.07467) http://t.cn/RPRnHTW [ [微博](http://www.weibo.com/5220650532/Bj60Vsc3k) ]
+
+2014-08-20 罗马帝国的40张地图 http://t.cn/RPRnTsJ 罗马的兴起,罗马的对外战争,罗马内战,罗马与中国和印度的贸易,罗马的衰落与遗产,尽在图中。 [ [微博](http://www.weibo.com/5220650532/Bj60OmI1b) ]
+
+2014-08-20 原来GIF小动画也这么有用又好玩,果然是数据结构入门利器。 里面的例子里给的代码不熟悉,貌似伪码。 [ [微博](http://www.weibo.com/5220650532/Bj5wH9EYO) ]
+
+2014-08-20 http://t.cn/RPRHgdY 补充树木计划链接 [good]//@复旦大学星空讲坛: 几天前星空还转过港中大的树木计划,希望旦旦也可以有自己的植物库[可怜] [ [微博](http://www.weibo.com/5220650532/Bj5fV5r3d) ]
+
+2014-08-19 生物百科全书 Encyclopedia of Life(EOL) 是一个免费在线全球物种档案馆。它自2008年上线就涵盖了3万物种,到2011年九月已经达到70万物种, 目标是在10年内为1百90万余已知的物种建立档案。http://t.cn/RP8mYWn @陆浑戎 推荐的《中国植物志》在线版、台湾生命大百科 都可以算是全球EOL联盟的一部分 [ [微博](http://www.weibo.com/5220650532/Bj16laqQn) ]
+
+2014-08-19 问: @jimmy_000 卷积神经网络CNN的“卷积”是一个什么样的过程? 它是怎样将图像的编码从像素level 上升到NxN区块的 答: 初步答案 http://t.cn/RP8QjNH 看看Andrew Ng 写的短教程Convolutional Neural Network, 中文有bzjia的Deep Learning学习随记。@赵家平USC 讲了不少深度学习在图像处理的前沿成果 [ [微博](http://www.weibo.com/5220650532/Bj0JM11rm) ]
+
+2014-08-19 [资料整理] 深度学习在语音识别的应用,入门篇: http://t.cn/RP8ll1s 向 @李开复 在CMU做的Sphinx(1988)致敬。介绍几个牛人和顶级团队: 微软 (邓力 Li Deng )和谷歌 (Vincent Vanhoucke, Geoffrey E. Hinton)。 [ [微博](http://www.weibo.com/5220650532/Bj0jOqW9v) ]
+
+2014-08-19 [资源整理] 不平衡数据分类(Imbalanced data classification): http://t.cn/RP8NM2s 经典文献 MetaCost (Domingo, 1999), SMOTE(2002 Chawla), 以及2004 CMU Yanjun Qi 的综述(现UVA教授);工具与数据集(WEKA,NLTK), GITHUB SMOTE的实现。感谢 @AixinSG @刘知远THU @xierqi @eacl_newsmth [ [微博](http://www.weibo.com/5220650532/BiZQEloKK) ]
+
+2014-08-19 问: @唐小sin 有没有multi-task learning的相关学习资料呢? 答: 维基百科上有不少经典文献。AAAI和ICML都有论文(北大/清华)。找到今年Honglak Lee (U Michigan 教授)的短教程。Lan Žagar 博士论文(2014) Ranking by Multitask Learning. 问答追踪: http://t.cn/RP8a3Ax 求补充 [ [微博](http://www.weibo.com/5220650532/BiZl47k80) ]
+
+2014-08-19 [资源整理 ] 中文词汇语义相似度计算方法与工具 http://t.cn/RP8IYvH 包括:python gensim,word2vector, GloVe, Explicit Semantic Analysis 资料卡片: http://t.cn/RP8IYvT 感谢 @杜振东_java @刘知远THU @昊奋 @算文解字 @Mr_UnderWaterrrrrr @朱鉴 @西瓜大丸子汤 @董力at北航 @尘绳聋-SYSU [ [微博](http://www.weibo.com/5220650532/BiYH4E1Gw) ]
+
+2014-08-18 搭车推荐 @赵家平USC 的微博 "Sebastian Seung 用CNN重建了老鼠视网膜里的plexiform layer;UCI的学者在nature上撰文说DL用于发现 希格斯玻色子"; Jeff Hinton组deep CNN(CovNets)在ImageNet; Fei-Fei组的 video classification with CNN 看问答进展:http://t.cn/RPQxZNF [ [微博](http://www.weibo.com/5220650532/BiUmllrLL) ]
+
+2014-08-18 非常感谢,身边的图像拼接/全景图应用:谷歌街景, iphone拍照, 汽车摄像头//@图像视觉研究: Lowe的Automatic Panoramic Image Stitching using Invariant Features绝对经典,OpenCV的拼接就是基于这个框架。另外沈向洋的Construction of Panoramic Image Mosaics with Global and Local Alignment也经典 [ [微博](http://www.weibo.com/5220650532/BiU6AsAmL) ]
+
+2014-08-18 问: @思考中的芦苇 有没有视频图像配准相关的资料呢?比如说卫星拍了一段地面上的遥感视频,如何从这段视频中提取出许多帧图像,然后进行图像配准,组成一幅地图呢? 答: 关键词Image Alignment and Stitching, remote sensing, 问答进展见http://t.cn/RPQ63GQ 求交流指点 [ [微博](http://www.weibo.com/5220650532/BiRyc2QGH) ]
+
+2014-08-18 阶段小结: 感谢热心专家 @唐小sin @善良的右行 推荐的好东西, 现在问答追踪 ( http://t.cn/RPQXlim )里已经有十几条相关文献了. 整理了一个总结, http://t.cn/RPQXliQ 看看行不行,欢迎参与编辑 [ [微博](http://www.weibo.com/5220650532/BiRkGCx0v) ]
+
+2014-08-18 回复@善良的右行: 这几个推荐文章都很好呀,第一篇引用率都快400了. 要不是了解领域,谁能想到这个关键词呢, influential spreaders . //@善良的右行:@好东西传送门 惭愧,我也是菜鸟,当然很乐意共享:Identification of influentialspreaders in complex networks;Leaders in Social Networks, the De [ [微博](http://www.weibo.com/5220650532/BiRevEmzM) ]
+
+2014-08-18 回复@唐小sin: 这篇文章很不错哦, 还对比了TunkRank, Topic-sensitive PageRank (TSPR) //@唐小sin:任何influence的文章都可以哪来读读,而至于意见领袖不妨看看twitterrank [ [微博](http://www.weibo.com/5220650532/BiRagmjE9) ]
+
+2014-08-18 发现重要节点一直是社交网络研究的重要问题, 研究热点大约在2007~2010社交媒体蓬勃发展的时候, 2014年已经有influential user identification的综述了.鉴于这类研究的算法并不困难,但数据量较大且较难获得,研究前沿已经逐渐从学术界转移到工业界/创业应用。http://t.cn/RPQfWRW [ [微博](http://www.weibo.com/5220650532/BiR72BfHw) ]
+
+2014-08-18 感谢指正, 能不能推荐几个好东西, 咱也找找 social network analysis 的文献 回复@善良的右行: 这几篇论文略旧……当然引用率是不用说的……貌似问题本质是重要节点挖掘 [ [微博](http://www.weibo.com/5220650532/BiQWI1oD2) ]
+
+2014-08-18 问: @马辰The_answer:主页君能否推荐一些用深度学习做推荐的文章资料 答: 问答进展 http://t.cn/RPQMg7Q 找到一篇今年8月新鲜出炉, Spotify的实习生博文: Recommending music on Spotify with deep learning .今年2月有人讲Netflix的电影推荐. 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BiQUcxKod) ]
+
+2014-08-18 问: @山东工商学院白建磊 有没有新媒体意见领袖领域方面的文献可以推荐? 答: 问答进展 http://t.cn/RPQfWRW . 初步推荐: 意见领袖 (opinion leader), user influence, twitter, 有几篇引用率很高的论文分析了Twitter用户影响力. 还有, 社交媒体信息传播综述. 欢迎补充指正. [ [微博](http://www.weibo.com/5220650532/BiQH4deoc) ]
+
+2014-08-17 //@见习烟酒生:出轨检测。。居然还有这么实用的案例//@西瓜大丸子汤:里面有一篇“女人是如何发现另一半出轨的” [哈哈] [ [微博](http://www.weibo.com/5220650532/BiGM9wr1F) ]
+
+2014-08-16 [求指点] @小白_小可乐:能帮忙找点"背景建模"的资料么?就是图像前景提取的方法. 关键词: 图像前景提取(Foreground Extraction), 视频分析, 背景建模(background object detection) 问答进展看这里: http://t.cn/RPTWX7w [ [微博](http://www.weibo.com/5220650532/BiBA9tX99) ]
+
+2014-08-16 大家一定要看韩家伟老师的异常检测讲义(是他数据挖掘教材第三版的第12章),就56页. 简明扼要! 直接给个讲义PPT 下载传送门 http://t.cn/RPTLh7M [ [微博](http://www.weibo.com/5220650532/BixYpiSEk) ]
+
+2014-08-16 问:@ai_东沂 异常检测应用在文本挖掘 答: 异常检测(outlier/anomaly detection)和文本挖掘(text mining)都是大课题。几篇异常检测综述(如韩家伟的讲义) 与应用(如发现金融欺诈); 几个异常检测用在文本挖掘的综述(如在对话流中发现新话题),以及话题模型的文献(如翟成祥的讲义) http://t.cn/RPYnZD8 [ [微博](http://www.weibo.com/5220650532/BixPQANza) ]
+
+2014-08-16 @维尔茨 问:有木有关于循环神经网络在segmented sequence labeling方面的papers? 答:多伦多大学Alex Graves有专著. 基于recurrent neural networks(RNN)研究, @ICT_朱亚东 推荐Herbert Jaeger的短教程. Jürgen Schmidhuber教授收集了60多相关论文, 微软研究院用RNN做自然语言处理 http://t.cn/RPYQVsY [ [微博](http://www.weibo.com/5220650532/BiuoeCGpy) ]
+
+2014-08-15 [实事求是学大数据] @猴山寨主找夫人 问:是否能提供一个入门级的大数据指导方案.答:盲目上大数据技术很容易浪费学习时间和运营成本。这里我们列了一个极简版,面向的是普通基础、需要从一般数据处理任务逐步扩展到大数据的用户,见长微博。完整导读见本文文字版 http://t.cn/RPjCbl7 [ [微博](http://www.weibo.com/5220650532/BimdAmKqK) ]
+
+2014-08-15 [good]//@孙明明_SmarterChina:这些资料都没有提到manifold Learning中的一篇非常重要的文献:Yoshua Bengio 的 Non-Local Estimation of Manifold Structure http://t.cn/RPj5iYv。 这个文章揭示了LLE/ISOMap代表的一类流形学习方法无法直接广泛应用的宿命。 [ [微博](http://www.weibo.com/5220650532/BijiQaRyl) ]
+
+2014-08-15 Apex出品 [good]//@zwner:个人觉得最普适有效的经典算法是SVD++ http://t.cn/RPjLPjx,在推荐模型本身上最有深度的是MF-GBRT http://t.cn/RPjLPjM。如果你想用一个code快速实现不少推荐算法,那请毫不犹豫使用我们的SVDFeature http://t.cn/zYRnUMA [ [微博](http://www.weibo.com/5220650532/BiiWGqD5P) ]
+
+2014-08-14 这个例子很合适送给@oyyNyanCat “机器学习数据挖掘方面的简单有趣应用” http://t.cn/RPlYDZx [ [微博](http://www.weibo.com/5220650532/BifsXvfQC) ]
+
+2014-08-14 特别推荐。最优化,逻辑回归,最大熵,主题模型,深度学习,相似度,搜索,一脉下来,整理的深入浅出,非常清晰。传送门君以前读过前一半,现在终于写全了! [ [微博](http://www.weibo.com/5220650532/BidtPx8pa) ]
+
+2014-08-13 最新数据显示: 美国Snapchat的用户渗透率稳步上升,在18-34岁的消费者市场首次超过Twitter。主要动力来自18-24岁人群的追捧。 http://t.cn/RPWBC1c [ [微博](http://www.weibo.com/5220650532/Bi90saK6K) ]
+
+2014-08-13 最近我们推荐过四组深度学习的资源,分别为语音检索,文本挖掘/自然语言处理,图像检索,最热深度学习Github项目。为方便大家浏览/粘帖,现在制作成可下载的PPT,每页是一个推荐资源的预览。百度云盘 http://t.cn/RPWoSHq slideshare http://t.cn/RPWoSHb 原始PPT http://t.cn/RPWoSH4 [ [微博](http://www.weibo.com/5220650532/Bi6AwyhV1) ]
+
+2014-08-13 http://t.cn/RPW6muz ACL2014 Semantic Parsing Workshop的slides 感谢@老淘 @波多野丽猪 推荐 [ [微博](http://www.weibo.com/5220650532/Bi6fQ8wYq) ]
+
+2014-08-13 //@ansj: @52nlp @好东西传送门 @v_小峰_v 墙裂推荐.应该是史上公开的最大最完整的中文词库了 [ [微博](http://www.weibo.com/5220650532/Bi65w5qIN) ]
+
+2014-08-13 回复@Liufool: 非常感谢,这个补充太专业了,果然是windows高手。话说微软的语音识别还是很牛的,你看这个当入门文档行吗? http://t.cn/RPWwj0A 顺带说一句, 曾经亲眼看见一个盲人科学家用语音操控windows笔记本。 //@Liufool:microsoft speech platform是服务器版windows可免费应用的语音识别, [ [微博](http://www.weibo.com/5220650532/Bi4olbouK) ]
+
+2014-08-13 问:@VoidStars 请问想提取一段文本里的中文姓名(0~1个) 有好的开源库和教程吗 答: 常见方法就是分词,再利用姓名词库和上下文关系来确定。 知呼有一个综述。google有专利。 @52nlp 也有大量博文讲中文分词。开源工具比较有名的有jieba, snownlp, stanford-nlp-ner. http://t.cn/RPWP2h1 [ [微博](http://www.weibo.com/5220650532/Bi3VHfSFP) ]
+
+2014-08-13 问: @yongsun 有没有开源或者免费的英文语音识别软件/或项目?打算翻译一些冰球教学的视频,想结合识别结果来进行听译 答: Windows7/8 自带语音识别功能,Google Chrome有基于云端服务的识别插件,软件方面Nuaunce的Dragon很牛(SIRI就是靠它做语音识别). 开源软件列表看维基百科。http://t.cn/RPODalA [ [微博](http://www.weibo.com/5220650532/Bi3ti7wAd) ]
+
+2014-08-13 问: 做 logistic regression 有啥好用的库吗? 需要处理几十万个 features, 然后几十亿个training data的。 features 是极其稀疏的,Sparsity大概万分之一左右吧 答: 有不少开源库: Spark(MLlib), Mahout, R+Hadoop, Hadoop, Scalding(Conjecture)。有2014分析指出SPARK比较快。http://t.cn/RPOddon [ [微博](http://www.weibo.com/5220650532/Bi3axDIR8) ]
+
+2014-08-13 [问题求领养] @不非否nonono:请问有没有关于causality与Bayesian Network有关的资料?http://t.cn/RPOR7Iv。除了Judea Pearl的书,大家有什么推荐?有没有你觉得比较好的教程?BTW, 以前在Python站上有过不少和贝叶斯相关的推荐资源 http://t.cn/RPOrpGD [ [微博](http://www.weibo.com/5220650532/Bi2Z7mgEI) ]
+
+2014-08-12 @刘知远THU 推荐:翟成祥老师(UIUC)的综述专著:Statistical Language Models for Information Retrieval(信息检索中的统计语言模式)(2008),从BM25到PLSA, LDA,回顾了领域发展并总结了未来的挑战。 [ [微博](http://www.weibo.com/5220650532/BhWzutAft) ]
+
+2014-08-12 [NLP讲义下载,125页,PDF] 翟成祥老师(UIUC)今年在澳大利亚数据库博士短训班的教程:"Statistical Methods for Mining Big Text Data" 介绍两种基于统计语言模型(Statistics Language Model)的基本话题模型(Topic Model): LDA和PLSA的原理及应用。最后列出六个未来研究课题。http://t.cn/RPO7vtW [ [微博](http://www.weibo.com/5220650532/BhWo26Y93) ]
+
+2014-08-12 //@昊奋: 对于ESA,如果单纯使用wikipedia,由于中文维基百科的语料相比英语小很多,所以其实不满足ESA本身需要有高覆盖率的好处,需要自行采用百度百科或互动百科进行处理。我们会考虑利用zhishi.me来为大家提供ESA的服务。 [ [微博](http://www.weibo.com/5220650532/BhWfVt47c) ]
+
+2014-08-12 这个问题还有很多其他选择方案,如知网。一些正在issue 67下讨论 http://t.cn/RP0pPIt 欢迎去那增补(留言请留下你的微博号) [ [讨论](https://github.com/memect/hao/issues/67) ] [ [微博](http://www.weibo.com/5220650532/BhWeO3CJx) ]
+
+2014-08-12 @talkto廖华 请问有没有好用的中文词汇的语义相似度计算工具?答:多种分布式表示方法都可以计算语义相似度,中英文均可以处理。如近来的word2vec http://t.cn/RPOvesp 和glove。@刘知远THU 推荐ESA(Explicit semantic analysis),在稳定性上可能更优,一些开源项目和文章如下 http://t.cn/RPOvesj [ [微博](http://www.weibo.com/5220650532/BhWdIDon6) ]
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+http://www.datarobot.com/blog/a-primer-on-deep-learning/ A Primer on Deep Learning (2014)
+
+
+
+### 基于编程语言的实战入门
+* http://deeplearning.net/tutorial/gettingstarted.html Getting Started (通过python编程学习基本概念)
+* http://karpathy.github.io/neuralnets/ 以独特视角讲NN(Javascript ConvNetJS )
+
+
+### 入门指南
+
+http://deeplearning.net/tutorial/ Deep Learning Tutorials
+* [600+ star on github](https://github.com/lisa-lab/DeepLearningTutorials)
+
+
+http://neuralnetworksanddeeplearning.com/index.html Michael Nielsen (2014) 概念讲得很细致
+* @自觉自愿来看老婆微博 共同推荐
+
+邓侃 Deep Learning 系列
+* http://blog.sina.com.cn/s/blog_46d0a3930101fswl.html Deep Learning 和 Knowledge Graph 引爆大数据革命
+* http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html Deep Learning 【2,3】
+* http://blog.sina.com.cn/s/blog_46d0a3930101h6nf.html Deep Learning 教程翻译
+
+http://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/ckdqtpe 伯克利Michael Jordan教授论深度学习, 附上[学习笔记](http://www.weibo.com/5220650532/BmtY3eXDx)
+1. layer,parallel,ensemble有用,不能限于模拟人脑思维
+2. backpropagation是关键, 本质是supervised learning
+3. 很多成功案例是大规模样本+监督学习
+4. 很少用在工业界咨询,不少其它问题(7个例子)
+5. 机器学习不止是AI,还要接近system与数据库
+
+
+## 综述与分支
+注意Vision、Text、Speech都用DL,用法不尽相同
+
+
+http://research.microsoft.com/pubs/204048/APSIPA-Trans2013-revised-final.pdf
+Li Deng, A Tutorial Survey of Architectures, Algorithms, and Applications for Deep Learning , in APSIPA Transactions on Signal and Information Processing, Cambridge University Press, 2014
+* 还有一个大部头 http://research.microsoft.com/pubs/209355/DeepLearning-NowPublishing-Vol7-SIG-039.pdf Deep Learning Methods and Applications, Li Deng and Dong Yu
+
+
+
+### Text 文本 NLP
+http://nlp.stanford.edu/courses/NAACL2013/ Deep Learning for Natural Language Processing (without Magic)
+* 自然语言处理 NLP 方向(文本为主)
+
+### Speech 语音 NLP
+http://research.microsoft.com/pubs/217165/ICASSP_DeepTextLearning_v07.pdf Deep learning for natural language processing and related applications (Tutorial at ICASSP)
+* Xiaodong He, Jianfeng Gao, and Li Deng
+* 自然语言处理 NLP 方向 (语音为主,也包括文本)
+* spoken language understanding (SLU), machine translation (MT), and semantic information retrieval (IR) from text.
+
+### Computer Vision 视觉
+https://sites.google.com/site/deeplearningcvpr2014/ TUTORIAL ON DEEP LEARNING FOR VISION
+* Computer vision, CVPR 2014 Tutorial
+* 计算机视觉 方向
+* cardbox http://bigdata.memect.com/?tag=cvpr2014+vision
+
+
+Yann LeCun's Lecture on Computer Perception with Deep Learning in Course 9.S912: "Vision and learning - computers and brains", Nov 12, 2013:
+* Part1: http://techtv.mit.edu/videos/26739-yann-lecun-computer-perception-with-deep-learning-part-1
+* Part2: http://techtv.mit.edu/videos/26740-yann-lecun-computer-perception-with-deep-learning-part-2
+* 计算机视觉 方向
+
+
+## 过去的相关推荐
+
+* https://github.com/memect/hao/issues/90 深度学习做推荐的文章资料
+* https://github.com/memect/hao/issues/39 机器学习和深度学习在多媒体信息检索领域的资源
+* https://github.com/memect/hao/issues/31 深度学习或者机器学习在图像检索
+* https://github.com/memect/hao/issues/181 deep learning相关的图像检索资料
+* https://github.com/memect/hao/issues/30 深度学习在文本挖掘或者自然语言处理(NLP)方面的好的资源
+* https://github.com/memect/hao/issues/168 Michael Jordan 论深度学习
+* https://github.com/memect/hao/issues/184 深度学习入门
+* https://github.com/memect/hao/issues/190 深度学习工具箱
+
+## 计算工具
+###theano
+
+
+### caffe
+
+
+### Torch-7
+
+
+
+### matlab deeplearning toolbox
+
+
diff --git a/awesome/entity-linking.md b/awesome/entity-linking.md
new file mode 100644
index 0000000..8f347fa
--- /dev/null
+++ b/awesome/entity-linking.md
@@ -0,0 +1,5 @@
+# reading lists
+http://nlp.cs.rpi.edu/kbp/2014/elreading.html Entity linking paper reading list, by Heng Ji.
+
+# tutorial
+http://nlp.cs.rpi.edu/paper/wikificationtutorial.pdf ACL 2014 wikification tutorial by Dan Roth (UIUC), Heng Ji (RPI), Ming-Wei Chang (MSR), and Taylor Cassidy (ARL, IBM)
diff --git a/awesome/fenci.md b/awesome/fenci.md
new file mode 100644
index 0000000..2ba7647
--- /dev/null
+++ b/awesome/fenci.md
@@ -0,0 +1,38 @@
+Ansj中文分词 java
+
+http://t.cn/zWDqIRw
+
+python 结巴分词
+
+http://t.cn/zlfOaMU
+
+结巴"中文分词的C++版本
+
+http://t.cn/RPICG0o
+
+技术文章:
+
+基础类(这两个选一个就可以):
+
+http://t.cn/RPICqae
+
+http://t.cn/zHm2KHK
+
+常用的算法
+CRF
+
+http://t.cn/RPIC5fy
+
+HMM
+
+http://t.cn/zOec8CW
+
+数据结构
+
+tire树
+
+http://t.cn/RPIC5mA
+
+双数组
+
+http://t.cn/ar6lK9
diff --git a/awesome/health-data.md b/awesome/health-data.md
new file mode 100644
index 0000000..ef57d73
--- /dev/null
+++ b/awesome/health-data.md
@@ -0,0 +1,25 @@
+国际组织相关卫生统计数据
+
+http://t.cn/8FDT5pG
+
+http://t.cn/RPSIhDv
+
+http://t.cn/RPSIhDZ
+
+http://t.cn/RPSIhDP
+
+美国卫生统计数据是分散在各个部门
+
+http://t.cn/RPSIhDh
+
+http://t.cn/RPSIhDz
+
+http://t.cn/RPSIhD7
+
+中国的卫生统计数据
+
+http://t.cn/zYK9zeF
+
+芝加哥大学有个主页搜集了一些卫生统计数据
+
+http://t.cn/RPSIhDw
diff --git a/awesome/image-cbr.md b/awesome/image-cbr.md
new file mode 100644
index 0000000..7351472
--- /dev/null
+++ b/awesome/image-cbr.md
@@ -0,0 +1,11 @@
+http://www.openimaj.org/
+
+http://www.openimaj.org/tutorial-pdf.pdf
+
+https://code.google.com/p/lire/
+
+http://demo-itec.uni-klu.ac.at/liredemo/
+
+http://www.phash.org/
+
+http://www.phash.org/docs/pubs/thesis_zauner.pdf
diff --git a/awesome/imbalanced-data-classification.md b/awesome/imbalanced-data-classification.md
new file mode 100644
index 0000000..334be83
--- /dev/null
+++ b/awesome/imbalanced-data-classification.md
@@ -0,0 +1,97 @@
+# 不平衡数据分类(Imbalanced data classification)
+
+contributors: AixinSG, 刘知远THU , xierqi , eacl_newsmth
+
+https://github.com/memect/hao/blob/master/awesome/imbalanced-data-classification.md
+
+card list: http://bigdata.memect.com/?tag=imbalanceddataclassification
+
+discussion: https://github.com/memect/hao/issues/47
+
+keywords:
+ Positive only,
+ Imbalanced data,
+ classification,
+
+
+## readings
+
+### survey
+http://www.cs.cmu.edu/~qyj/IR-Lab/ImbalancedSummary.html Yanjun Qi, A Brief Literature Review of Class Imbalanced Problem
+(2004)
+
+### classic
+http://homes.cs.washington.edu/~pedrod/papers/kdd99.pdf (@xierqi 推荐) Domingo, MetaCost: A General Method for Making Classifiers Cost, KDD 1999
+
+https://www.jair.org/media/953/live-953-2037-jair.pdf SMOTE: Synthetic Minority Over-sampling Technique (2002) JAIR
+
+
+http://cseweb.ucsd.edu/~elkan/posonly.pdf Learning Classifiers from Only Positive and Unlabeled Data (2008)
+
+http://www.ele.uri.edu/faculty/he/PDFfiles/ImbalancedLearning.pdf Haibo He, Edwardo A. Garcia . (2009). Learning from Imbalanced Data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263-1284.
+
+http://www.computer.org/csdl/proceedings/icnc/2008/3304/04/3304d192-abs.html Guo, X., Yin, Y., Dong, C., Yang, G., & Zhou, G. (2008). On the Class Imbalance Problem. 2008 Fourth International Conference on Natural Computation (pp. 192-201).
+
+
+
+### current
+http://www.aclweb.org/anthology/P/P13/P13-2141.pdf (@eacl_newsmth 推荐) Towards Accurate Distant Supervision for Relational Facts Extraction, acl 2013
+
+http://link.springer.com/article/10.1007/s10618-012-0295-5 Training and assessing classification rules with imbalanced data (2014) Data Mining and Knowledge Discovery
+
+http://www.aaai.org/ocs/index.php/AAAI/AAAI13/paper/viewFile/6353/6827 An Effective Approach for Imbalanced Classification: Unevenly Balanced Bagging (2013) AAAI
+
+
+
+
+### further readings
+http://stackoverflow.com/questions/12877153/tools-for-multiclass-imbalanced-classification-in-statistical-packages
+
+
+## tools
+
+http://www.nltk.org/_modules/nltk/classify/positivenaivebayes.html nltk
+
+http://weka.wikispaces.com/MetaCost Weka
+
+http://tokestermw.github.io/posts/imbalanced-datasets-random-forests/ smote
+
+https://github.com/fmfn/UnbalancedDataset based on SMOTE
+
+## datasets
+
+http://pages.cs.wisc.edu/~dpage/kddcup2001/ Prediction of Molecular Bioactivity for Drug Design -- Binding to Thrombin
+
+http://code.google.com/p/imbalanced-data-sampling/ Imbalanced Data Sampling Using Sample Subset Optimization
+
+#### dataset list
+https://archive.ics.uci.edu/ml/datasets.html?format=&task=cla&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=table UCI dataset repo, classification category
+
+http://www.inf.ed.ac.uk/teaching/courses/dme/html/datasets0405.html dataset list
+
+
+## discussion
+### @eastone01 不平衡数据分类数据集 https://github.com/memect/hao/issues/47
+
+请问目前有木有关于不平衡数据分类(imbalance dataset classification)任务的人工二维toy dataset?
+
+AixinSG:Undersampling 总体上效果有限,个人理解
+
+刘知远THU: 不平衡数据分类,尤其是标注正例特别多,几乎没有标注负例,但有大量未标注数据的话,应当怎么处理呢?这个问题在relation extraction中很普遍。现在只能在大量未标注数据中随机抽样作为负例。
+
+xierqi: 有段调研过这方面,90%都是采样,最大问题是评估方法不适合真实场景。个人推荐domingos的meta-cost,非常实用,经验设下cost就好。http://t.cn/RPiexE9
+
+eacl_newsmth: 在关系抽取中,是正例特别多? 没有负例么?我怎么觉得很多情况下是正例有限,但负例很多(当然你也可以argue说负例其实很难界定)。。。。
+
+刘知远THU:回复@eacl_newsmth: 就像knowledge graph中可以提供很多正例,但负例需要通过随机替换正例中的entity来产生,这样容易把也是正确的样例当成负例来看。
+
+eacl_newsmth:回复@刘知远THU:恩,我估计你就要说这个例子,所以我在后面说,看你怎么界定负例,哈哈,我也纠结过好久,后来觉得其实还是正例少,而且很多时候你能保证正例是对的么?
+
+刘知远THU:回复@eacl_newsmth: 正例基本是正确的,例如来自Freebase的,但负例对效果影响很大。:)今年AAAI有篇MSRA做的TransH的模型中,就提出一个负例选取的trick,效果拔群。
+
+eacl_newsmth:回复@刘知远THU:恩,KB中的实例确实是正确的,但是依据这些实例去海量文档中寻找的那些样本未必是正确的啊。 就目前的工作来看,确实很多在负例上做文章的工作都能把效率提升一些,去年语言所的一个学生利用“关系”特性,优选训练样本,也确实能提升性能。但单就这个问题而言,不能回避正例的可靠性
+
+刘知远THU:回复@eacl_newsmth: 你说的这篇文章能告诉一下题目么?我现在关注的还不是从文本中抽关系,而是做knowledge graph completion,有点类似于graph上的link prediction,但要预测的link是有不同类型的relation。
+
+eacl_newsmth:回复@刘知远THU:http://t.cn/RPX75A3 恩,看了你们那里一个小伙的talk,感觉和sebastian之前的工作很相关啊,也许是他表述的问题?啥时候回北京?可以好好讨论一下。
+
diff --git a/awesome/influential-user-social-network.md b/awesome/influential-user-social-network.md
new file mode 100644
index 0000000..7ed1c2b
--- /dev/null
+++ b/awesome/influential-user-social-network.md
@@ -0,0 +1,90 @@
+# Influential User Identification in Online Social Networks
+
+contributors: @唐小sin @善良的右行
+
+discussion: https://github.com/memect/hao/issues/89
+
+keywords:
+ 意见领袖 ( opinion leader),
+ user influence,
+ influential spreaders ,
+ influential user ,
+ twitter ,
+
+# 微博讨论精华
+
+善良的右行:@好东西传送门 这几篇论文略旧……当然引用率是不用说的……貌似问题本质是重要节点挖掘……菜鸟冒泡一下……不知说的对不对…… (今天 14:45)
+
+好东西传送门:发现重要节点一直是社交网络研究的重要问题, 研究热点大约在2007~2010社交媒体蓬勃发展的时候, 2014年已经有influential user identification的综述了.鉴于这类研究的算法并不困难,但数据量较大且较难获得,研究前沿已经逐渐从学术界转移到工业界/创业应用。http://t.cn/RPQfWRW (52分钟前)
+
+唐小sin:的确是这样,现在social influence这块需要一个很好的问题去解,感觉就是做得太多很难入手。
+
+
+
+唐小sin:任何influence的文章都可以哪来读读,而至于意见领袖不妨看看twitterrank (今天 15:13)
+
+好东西传送门:回复@唐小sin: 这篇文章很不错哦, 还对比了TunkRank, Topic-sensitive PageRank (TSPR) (44分钟前)
+
+
+善良的右行:@好东西传送门 惭愧,我也是菜鸟,当然很乐意共享:Identification of influentialspreaders in complex networks;Leaders in Social Networks, the Delicious Case; Absence of influential spreaders in rumor dynamics,都是牛人牛文……
+
+
+@好东西传送门: 回复@善良的右行: 这几个推荐文章都很好呀,第一篇引用率都快400了. 要不是了解领域,谁能想到这个关键词呢, influential spreaders . 意共享:Identification of influentialspreaders in complex networks;Leaders in Social Networks, the De
+
+
+
+
+# readings
+
+## industry
+http://mashable.com/2014/02/25/socialrank-brands/ SocialRank Tool Helps Brands Find Most Valuable Followers (2014)
+
+http://www.smallbusinesssem.com/find-interesting-influential-twitter-users/3974/ Quick Way to Find Interesting & Influential Twitter Users (2011)
+
+## readings
+
+### influential user/spreader identification/ranking
+http://link.springer.com/chapter/10.1007/978-3-319-01778-5_37 Survey of Influential User Identification Techniques in Online Social Networks (2014) Advances in Intelligent Systems and Computing
+
+http://dl.acm.org/citation.cfm?id=1835935 Yu Wang, Gao Cong, Guojie Song, and Kunqing Xie. 2010. Community-based greedy algorithm for mining top-K influential nodes in mobile social networks. In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '10)
+
+http://ink.library.smu.edu.sg/cgi/viewcontent.cgi?article=1503&context=sis_research Twitterrank: Finding Topic-Sensitive Influential Twitterers 2010
+@唐小sin 推荐
+
+http://www.anderson.ucla.edu/faculty/anand.bodapati/Determining-Influential-Users.pdf Determining Influential Users in Internet Social Networks
+
+http://polymer.bu.edu/hes/articles/kghlmsm10.pdf Identification of influential spreaders in complex networks
+@善良的右行 推荐
+
+http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0021202 Lü L, Zhang Y-C, Yeung CH, Zhou T (2011) Leaders in Social Networks, the Delicious Case. PLoS ONE 6(6)
+@善良的右行 推荐
+
+http://arxiv.org/pdf/1112.2239.pdf Absence of influential spreaders in rumor dynamics
+@善良的右行 推荐
+
+### measure influence
+
+http://blog.datalicious.com/awesome-new-research-measuring-twitter-user-influence-from-meeyoung-cha-max-planck-institute/ Awesome new research: Measuring twitter user influence from Meeyoung Cha, Max Planck Institute (2010) read the original paper below
+
+http://www.aaai.org/ocs/index.php/ICWSM/ICWSM10/paper/viewFile/1538%20Amit%20Goyal%2C%20Francesco%20Bonchi%2C%20Laks%20V.%20S.%20Lakshmanan%3A%20Approximation%20Analysis%20of%20Influence%20Spread%20in%20Social%20Networks%20CoRR%20abs/1826 Measuring User Influence in Twitter: The Million Follower Fallacy
+
+http://dl.acm.org/citation.cfm?id=2480726
+Mario Cataldi, Nupur Mittal, and Marie-Aude Aufaure. 2013. Estimating domain-based user influence in social networks. In Proceedings of the 28th Annual ACM Symposium on Applied Computing (SAC '13).
+
+http://www.cse.ust.hk/~qnature/pdf/globecom13.pdf Analyzing the Influential People in Sina Weibo
+Dataset (2013)
+
+http://dl.acm.org/citation.cfm?id=1935845
+Eytan Bakshy, Jake M. Hofman, Winter A. Mason, and Duncan J. Watts. 2011. Everyone's an influencer: quantifying influence on twitter. In Proceedings of the fourth ACM international conference on Web search and data mining (WSDM '11)
+
+
+
+## related
+http://en.wikipedia.org/wiki/Opinion_leadership
+
+http://dl.acm.org/citation.cfm?id=2503797
+Adrien Guille, Hakim Hacid, Cecile Favre, and Djamel A. Zighed. 2013. Information diffusion in online social networks: a survey. SIGMOD Rec. 42, 2 (July 2013), 17-28.
+
+http://dl.acm.org/citation.cfm?id=2601412 Charu Aggarwal and Karthik Subbian. 2014. Evolutionary Network Analysis: A Survey. ACM Comput. Surv. 47, 1, Article 10 (May 2014), 36 pages.
+
+
diff --git a/awesome/learn-big-data.md b/awesome/learn-big-data.md
new file mode 100644
index 0000000..6085346
--- /dev/null
+++ b/awesome/learn-big-data.md
@@ -0,0 +1,73 @@
+# 大数据应用与技术 - 入门资源汇编
+
+大数据是一个内涵非常广泛的概念,涵盖了统计,数据科学,机器学习,数据挖掘,分布式数据库,分布式计算,云端存储,信息可视化等等诸多领域.
+更详细的领域列表可以见Github上的 [Awesome Big Data](https://github.com/onurakpolat/awesome-bigdata)
+
+一般个人和中小企业学习大数据可以先了解一些大数据应用的案例,再基于自身拥有的数据与业务(不论大小)进行实践.
+注意, 盲目上大数据技术很容易浪费学习时间,也能带来大量不必要的运营成本.
+
+
+## 大数据应用 - 什么算大数据
+
+作为产品经理, 要了解大数据的基本概念和特点,进而找到与自身业务流程相关的地方. 也要多看看大数据应用案例,鉴于这些应用的规模很有可能只能在500强企业中才会出现,中小企业应要灵活学习而不必照搬技术框架.
+
+http://www.planet-data.eu/sites/default/files/presentations/Big_Data_Tutorial_part4.pdf 这个大数据讲义(2012, 41页)综合了很多关于大数据的分析图表,也列举了不少关键技术用例.
+
+http://hortonworks.com/blog/7-key-drivers-for-the-big-data-market/ 该文整理了在高盛云计算大会学到的核心概念.
+
+
+
+## 大数据技术 - 简版进阶方案
+
+要想成为数据科学家, 通常可以选修网上相关课程,如coursera和小象学院.
+这里我们面向Excel为基础的中小企业初学者设计一个简版进阶方案.
+
+第0级:电子表格Excel -- 实现简单的数据分析与图表
+
+第1级:关系数据库和SQL语言,例如Access和MySQL -- 利用数据库查询聚合大量业务数据纪录
+
+第2级:基础的编程语言,例如Python/R,Java -- 通过程序将数据处理流程自动化
+
+第3级:在程序中访问数据库,例如ORM, ODBC, JDBC -- 进一步提高数据处理自动化程度
+
+第4级:了解一个NoSQL数据库,例如redis,mongodb,neo4j,elasticsearch -- 根据业务需要选择一个合用的就行,传统关系数据库的性能未必不够用.
+
+第5级:了解一点数据分析(含机器学习/数据挖掘)常识,如线性回归,多项式拟合,逻辑回归,KNN聚类,决策树,Naive贝叶斯等.Python/R/Java都有现成实现
+
+第6级:如果需要使用变态多的计算/存储资源,学习云计算平台,如亚马逊的EC2, S3, Google Compute Engine, Microsoft Azure
+
+第7级:如果要处理变态多的数据,学习分布式计算Hadoop和MapReduce的原理,然后使用一个现成的实现,如Amazon Elastic MapReduce (Amazon EMR)
+
+第8级:如果要在变态多的数据上做数据分析,学习spark, mahout 或任何一个SQL on Hadoop.
+
+到此恭喜你,在任何一个"大数据群"都可以指点江山了.
+
+
+## 傻瓜入门参考书
+
+(英文) Big Data Glossary 大数据入门指导图书,主要讲解大数据处理技术及工具,内容涵盖了NoSql Database,各种MapReduce,Storage,Servers,数据清理阶段工具,NLP库与工具包,Machine learning机器学习工具包,数据可视化工具包,公共数据清洗,序列化指南等等。有点老(2011),不过重点推荐。有免费pdf
+http://download.bigbata.com/ebook/oreilly/books/Big_Data_Glossary.pdf
+
+(英文) Big Data For Dummies 有免费pdf http://it-ebooks.info/book/2082/
+
+"大数据时代从入门到全面理解" http://book.douban.com/review/6131027/ 适合了解大数据的一些基本概念.不过作者看法有些片面, 有很多吸引眼球的段子, 但与技术流结合地不够紧密.
+
+## 数据科学家学习资源
+
+http://www.douban.com/note/247983915/ 数据科学家的各种资源
+
+http://www.aboutyun.com/thread-7569-1-1.html 大数据入门:各种大数据技术介绍
+
+https://class.coursera.org/datasci-001 coursera上的公开课 大数据科学入门 Introduction to Data Science
+
+
+## 应用案例资源
+
+http://www.ibm.com/big-data/us/en/big-data-and-analytics/case-studies.html IBM的一些大数据分析案例
+
+http://www.sas.com/resources/asset/Big-Data-in-Big-Companies.pdf SAS的大数据案例
+
+http://www.teradata.com/big-data/use-cases/ Teradata的大数据案例
+
+
+
diff --git a/awesome/machine-learning-guide.md b/awesome/machine-learning-guide.md
new file mode 100644
index 0000000..ad3d8f4
--- /dev/null
+++ b/awesome/machine-learning-guide.md
@@ -0,0 +1,264 @@
+# 机器学习入门资源不完全汇总
+2014-10-14版, 好东西传送门编辑整理, 原文链接 http://ml.memect.com/article/machine-learning-guide.html
+
+感谢贡献者: tang_Kaka_back@新浪微博
+
+欢迎补充指正,转载请保留原作者和原文链接。本文是[机器学习日报](http://ml.memect.com)的一个专题合集,欢迎订阅: 给hao@memect.com发个邮件,标题"订阅机器学习日报"。
+
+[基本概念](#基本概念) | [入门攻略](#入门攻略) | [课程资源](#课程资源) | [论坛网站](#论坛网站) | [东拉西扯](#东拉西扯)
+
+
+
+## 基本概念
+[机器学习](http://zh.wikipedia.org/zh/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0) "机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。**机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法**。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。" --摘自维基百科
+
+[How do you explain Machine Learning and Data Mining to non Computer Science people? @quora](http://www.quora.com/How-do-you-explain-Machine-Learning-and-Data-Mining-to-non-Computer-Science-people) by Pararth Shah, 中文版 [如何向小白介绍何谓机器学习和数据挖掘?买回芒果他就懂了 @36kr](http://www.36kr.com/p/200601.html) -- 这印证了上面讲的定义 “机器学习就是从现象中发现统计规律,再利用规律预测”。当一车水果混作一团时,监督学习(supervised learning)能根据你提供的几个苹果样本帮你把所有苹果从梨,芒果中区分出来; 无监督学习(unsupervised learning)能根据已知的各种特征,无需样本自动把类似的水果分上几堆(也许是红水果和黄水果,也许是大苹果小苹果,...);关联规则学习(association rule learning) 则是帮你发现基于规则的规律,例如绿色的小苹果都有点酸。
+
+
+下面从微观到宏观试着梳理一下机器学习的范畴:一个具体的算法,领域进一步细分,实战应用场景,与其他领域的关系。
+
+
+
+图1: 机器学习的例子:NLTK监督学习的工作流程图 (source: http://www.nltk.org/book/ch06.html)
+
+
+
+图2: 机器学习概要图 by Yaser Abu-Mostafa (Caltech) (source: http://work.caltech.edu/library/181.html)
+
+
+
+
+图3: 机器学习实战:在python scikit learn 中选择机器学习算法 by Nishant Chandra (source: http://n-chandra.blogspot.com/2013/01/picking-machine-learning-algorithm.html)
+
+
+
+
+图4: 机器学习和其他学科的关系: 数据科学的地铁图 by Swami Chandrasekaran (source: http://nirvacana.com/thoughts/becoming-a-data-scientist/)
+
+
+## 入门攻略
+
+大致分三类: 起步体悟,实战笔记,行家导读
+
+* [机器学习入门者学习指南 @果壳网](http://www.guokr.com/post/512037/) (2013) 作者 [白马](http://www.guokr.com/group/i/0373595356/) -- [起步体悟] 研究生型入门者的亲身经历
+
+* [有没有做机器学习的哥们?能否介绍一下是如何起步的 @ourcoders](http://ourcoders.com/thread/show/2837/) -- [起步体悟] 研究生型入门者的亲身经历,尤其要看[reyoung](http://ourcoders.com/user/show/25895/reyoung/)的建议
+
+* [tornadomeet 机器学习 笔记](http://www.cnblogs.com/tornadomeet/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/) (2013) -- [实战笔记] 学霸的学习笔记,看看小伙伴是怎样一步一步地掌握“机器学习”
+
+* [Machine Learning Roadmap: Your Self-Study Guide to Machine Learning](https://machinelearningmastery.com/machine-learning-roadmap-your-self-study-guide-to-machine-learning/) (2014) Jason Brownlee -- [行家导读] 虽然是英文版,但非常容易读懂。对Beginner,Novice,Intermediate,Advanced读者都有覆盖。
+ * [A Tour of Machine Learning Algorithms](http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/) (2013) 这篇关于机器学习算法分类的文章也非常好
+ * [Best Machine Learning Resources for Getting Started](http://machinelearningmastery.com/best-machine-learning-resources-for-getting-started/)(2013) 这片有中文翻译 [机器学习的最佳入门学习资源 @伯乐在线](http://blog.jobbole.com/56256/) 译者 [programmer_lin](http://www.jobbole.com/members/linwenhui/)
+
+
+* 门主的几个建议
+ * 既要有数学基础,也要编程实践
+ * 别怕英文版,你不懂的大多是专业名词,将来不论写文章还是读文档都是英文为主
+ * [我是小广告][我是小广告]订阅机器学习日报,跟踪业内热点资料。
+
+
+### 更多攻略
+
+* [机器学习该怎么入门 @知乎](http://www.zhihu.com/question/20691338) (2014)
+* [What's the easiest way to learn machine learning @quora](http://www.quora.com/Whats-the-easiest-way-to-learn-machine-learning) (2013)
+* [What is the best way to study machine learning @quora](http://www.quora.com/What-is-the-best-way-to-study-machine-learning) (2012)
+* [Is there any roadmap for learning Machine Learning (ML) and its related courses at CMU Is there any roadmap for learning Machine Learning (ML) and its related courses at CMU](http://www.quora.com/Is-there-any-roadmap-for-learning-Machine-Learning-ML-and-its-related-courses-at-CMU) (2014)
+
+## 课程资源
+Tom Mitchell 和 Andrew Ng 的课都很适合入门
+
+### 入门课程
+
+#### 2011 Tom Mitchell(CMU)机器学习
+ [英文原版视频与课件PDF](http://www.cs.cmu.edu/~tom/10701_sp11/lectures.shtml) 他的《机器学习》在很多课程上被选做教材,有中文版。
+* Decision Trees
+* Probability and Estimation
+* Naive Bayes
+* Logistic Regression
+* Linear Regression
+* Practical Issues: Feature selection,Overfitting ...
+* Graphical models: Bayes networks, EM,Mixture of Gaussians clustering ...
+* Computational Learning Theory: PAC Learning, Mistake bounds ...
+* Semi-Supervised Learning
+* Hidden Markov Models
+* Neural Networks
+* Learning Representations: PCA, Deep belief networks, ICA, CCA ...
+* Kernel Methods and SVM
+* Active Learning
+* Reinforcement Learning
+以上为课程标题节选
+
+#### 2014 Andrew Ng (Stanford)机器学习
+ [英文原版视频](https://www.coursera.org/course/ml) | [果壳讨论](http://mooc.guokr.com/course/16/Machine-Learning/) 这就是针对自学而设计的,免费还有修课认证。“老师讲的是深入浅出,不用太担心数学方面的东西。而且作业也非常适合入门者,都是设计好的程序框架,有作业指南,根据作业指南填写该完成的部分就行。”(参见白马同学的入门攻略)"推荐报名,跟着上课,做课后习题和期末考试。(因为只看不干,啥都学不会)。" (参见reyoung的建议)
+
+ 1. Introduction (Week 1)
+ 2. Linear Regression with One Variable (Week 1)
+ 3. Linear Algebra Review (Week 1, Optional)
+ 4. Linear Regression with Multiple Variables (Week 2)
+ 5. Octave Tutorial (Week 2)
+ 6. Logistic Regression (Week 3)
+ 7. Regularization (Week 3)
+ 8. Neural Networks: Representation (Week 4)
+ 9. Neural Networks: Learning (Week 5)
+ 10. Advice for Applying Machine Learning (Week 6)
+ 11. Machine Learning System Design (Week 6)
+ 12. Support Vector Machines (Week 7)
+ 13. Clustering (Week 8)
+ 14. Dimensionality Reduction (Week 8)
+ 15. Anomaly Detection (Week 9)
+ 16. Recommender Systems (Week 9)
+ 17. Large Scale Machine Learning (Week 10)
+ 18. Application Example: Photo OCR
+ 19. Conclusion
+
+### 进阶课程
+
+**2013年Yaser Abu-Mostafa (Caltech) Learning from Data** -- 内容更适合进阶
+[课程视频,课件PDF@Caltech](http://work.caltech.edu/lectures.html)
+
+ 1. The Learning Problem
+ 2. Is Learning Feasible?
+ 3. The Linear Model I
+ 4. Error and Noise
+ 5. Training versus Testing
+ 6. Theory of Generalization
+ 7. The VC Dimension
+ 8. Bias-Variance Tradeoff
+ 9. The Linear Model II
+ 10. Neural Networks
+ 11. Overfitting
+ 12. Regularization
+ 13. Validation
+ 14. Support Vector Machines
+ 15. Kernel Methods
+ 16. Radial Basis Functions
+ 17. Three Learning Principles
+ 18. Epilogue
+
+**2014年 林軒田(国立台湾大学) 機器學習基石 (Machine Learning Foundations)** -- 内容更适合进阶,華文的教學講解
+[课程主页](https://www.coursera.org/course/ntumlone)
+
+When Can Machines Learn? [何時可以使用機器學習]
+ The Learning Problem [機器學習問題]
+-- Learning to Answer Yes/No [二元分類]
+-- Types of Learning [各式機器學習問題]
+-- Feasibility of Learning [機器學習的可行性]
+
+Why Can Machines Learn? [為什麼機器可以學習]
+-- Training versus Testing [訓練與測試]
+-- Theory of Generalization [舉一反三的一般化理論]
+-- The VC Dimension [VC 維度]
+-- Noise and Error [雜訊一錯誤]
+
+How Can Machines Learn? [機器可以怎麼樣學習]
+-- Linear Regression [線性迴歸]
+-- Linear `Soft' Classification [軟性的線性分類]
+-- Linear Classification beyond Yes/No [二元分類以外的分類問題]
+-- Nonlinear Transformation [非線性轉換]
+
+How Can Machines Learn Better? [機器可以怎麼樣學得更好]
+-- Hazard of Overfitting [過度訓練的危險]
+-- Preventing Overfitting I: Regularization [避免過度訓練一:控制調適]
+-- Preventing Overfitting II: Validation [避免過度訓練二:自我檢測]
+-- Three Learning Principles [三個機器學習的重要原則]
+
+
+
+### 更多选择
+
+**2008年Andrew Ng CS229 机器学习** -- 这组视频有些年头了,主讲人这两年也高大上了.当然基本方法没有太大变化,所以课件PDF可下载是优点。
+[中文字幕视频@网易公开课](http://v.163.com/special/opencourse/machinelearning.html) | [英文版视频@youtube](https://www.youtube.com/playlist?list=PLA89DCFA6ADACE599) |
+[课件PDF@Stanford](http://cs229.stanford.edu/materials.html)
+
+ 第1集.机器学习的动机与应用
+ 第2集.监督学习应用.梯度下降
+ 第3集.欠拟合与过拟合的概念
+ 第4集.牛顿方法
+ 第5集.生成学习算法
+ 第6集.朴素贝叶斯算法
+ 第7集.最优间隔分类器问题
+ 第8集.顺序最小优化算法
+ 第9集.经验风险最小化
+ 第10集.特征选择
+ 第11集.贝叶斯统计正则化
+ 第12集.K-means算法
+ 第13集.高斯混合模型
+ 第14集.主成分分析法
+ 第15集.奇异值分解
+ 第16集.马尔可夫决策过程
+ 第17集.离散与维数灾难
+ 第18集.线性二次型调节控制
+ 第19集.微分动态规划
+ 第20集.策略搜索
+
+
+**2012年余凯(百度)张潼(Rutgers) 机器学习公开课** -- 内容更适合进阶
+[课程主页@百度文库](http://wenku.baidu.com/course/view/49e8b8f67c1cfad6195fa705) | [课件PDF@龙星计划](http://bigeye.au.tsinghua.edu.cn/DragonStar2012/download.html)
+
+ 第1节Introduction to ML and review of linear algebra, probability, statistics (kai)
+ 第2节linear model (tong)
+ 第3节overfitting and regularization(tong)
+ 第4节linear classification (kai)
+ 第5节basis expansion and kernelmethods (kai)
+ 第6节model selection and evaluation(kai)
+ 第7节model combination (tong)
+ 第8节boosting and bagging (tong)
+ 第9节overview of learning theory(tong)
+ 第10节optimization in machinelearning (tong)
+ 第11节online learning (tong)
+ 第12节sparsity models (tong)
+ 第13节introduction to graphicalmodels (kai)
+ 第14节structured learning (kai)
+ 第15节feature learning and deeplearning (kai)
+ 第16节transfer learning and semi supervised learning (kai)
+ 第17节matrix factorization and recommendations (kai)
+ 第18节learning on images (kai)
+ 第19节learning on the web (tong)
+
+
+
+
+## 论坛网站
+### 中文
+http://www.52ml.net/ 我爱机器学习
+
+http://www.mitbbs.com/bbsdoc/DataSciences.html MITBBS- 电脑网络 - 数据科学版
+
+http://www.guokr.com/group/262/ 果壳 > 机器学习小组
+
+http://cos.name/cn/forum/22 统计之都 » 统计学世界 » 数据挖掘和机器学习
+
+http://bbs.byr.cn/#!board/ML_DM 北邮人论坛 >> 学术科技 >> 机器学习与数据挖掘
+
+
+### 英文
+https://github.com/josephmisiti/awesome-machine-learning 机器学习资源大全
+
+http://work.caltech.edu/library/ Caltech 机器学习视频教程库,每个课题一个视频
+
+http://www.kdnuggets.com/ 数据挖掘名站
+
+http://www.datasciencecentral.com/ 数据科学中心网站
+
+
+## 东拉西扯
+一些好东西,入门前未必看得懂,要等学有小成时再看才能体会。
+
+[机器学习与数据挖掘的区别](http://en.wikipedia.org/wiki/Machine_learning#Machine_learning_and_data_mining)
+* 机器学习关注从训练数据中学到已知属性进行预测
+* 数据挖掘侧重从数据中发现未知属性
+
+[Dan Levin, What is the difference between statistics, machine learning, AI and data mining?](http://www.quora.com/What-are-some-good-machine-learning-jokes)
+* If there are up to 3 variables, it is statistics.
+* If the problem is NP-complete, it is machine learning.
+* If the problem is PSPACE-complete, it is AI.
+* If you don't know what is PSPACE-complete, it is data mining.
+
+几篇高屋建瓴的机器学习领域概论, 参见[原文](http://machinelearningmastery.com/best-machine-learning-resources-for-getting-started/)
+* [The Discipline of Machine Learning](http://www.cs.cmu.edu/~tom/pubs/MachineLearning.pdf)Tom Mitchell 当年为在CMU建立机器学习系给校长写的东西。
+* [A Few Useful Things to Know about Machine Learning](http://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf) Pedro Domingos教授的大道理,也许入门时很多概念还不明白,上完公开课后一定要再读一遍。这是刘知远翻译的中文版 [机器学习那些事 PDF](http://www.valleytalk.org/wp-content/uploads/2012/11/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E9%82%A3%E4%BA%9B%E4%BA%8B.pdf)
+
+几本好书,书籍推荐很多高人都做过,这里就不多说了,直接给链接
+* [Machine Learning in Action](http://manning.com/pharrington/) Peter Harrington 中文版 [机器学习实战 @豆瓣](http://book.douban.com/subject/24703171/) -- “这本书能让你明白:那些被吹捧得出神入化的分类算法,竟然实现起来如此简单; 那些看是高深的数学理论,其实一句话就能道明其本质; 一切复杂的事物,出发点都是非常简单的想法。” 摘自[Kord @豆瓣](http://book.douban.com/review/6249619/)的评论
+* 李航博士的书 [统计学习方法 @豆瓣](http://book.douban.com/subject/10590856/) -- 首先这是一本好书,“如果我什么都不知道,这种干货为主的传统教科书很可能会让我讨厌机器学习的(个人观点)。但是,如果把这本书作为参考书,那将是非常好的一本,一方面算是比较权威吧,另一方面是简洁,用公式、逻辑说话,不做太多通俗的解释,比起PRML等书就简洁了很多,有着独特的魅力和市场需求。” 摘自[chentingpc @豆瓣](http://book.douban.com/review/5540889/)的评论
+* [机器学习经典书籍 @算法组](http://suanfazu.com/discussion/109/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%BB%8F%E5%85%B8%E4%B9%A6%E7%B1%8D/p1) by [算法组](http://www.weibo.com/suanfazu)
diff --git a/awesome/machine-learning-reading.md b/awesome/machine-learning-reading.md
new file mode 100644
index 0000000..f10a543
--- /dev/null
+++ b/awesome/machine-learning-reading.md
@@ -0,0 +1,30 @@
+
+
+## readings recommend by michael jordan
+
+source: http://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/ckdqzph
+
+"I now tend to add some books that dig still further into foundational topics. In particular, I recommend A. Tsybakov's book "Introduction to Nonparametric Estimation" as a very readable source for the tools for obtaining lower bounds on estimators, and Y. Nesterov's very readable "Introductory Lectures on Convex Optimization" as a way to start to understand lower bounds in optimization. I also recommend A. van der Vaart's "Asymptotic Statistics", a book that we often teach from at Berkeley, as a book that shows how many ideas in inference (M estimation---which includes maximum likelihood and empirical risk minimization---the bootstrap, semiparametrics, etc) repose on top of empirical process theory. I'd also include B. Efron's "Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction", as a thought-provoking book"
+
+
+http://www.amazon.com/Introduction-Nonparametric-Estimation-Springer-Statistics/dp/1441927093
+Introduction to Nonparametric Estimation
+
+
+
+http://www.amazon.com/Introductory-Lectures-Convex-Optimization-Applied/dp/1402075537
+Introductory Lectures on Convex Optimization
+
+
+
+
+http://www.amazon.com/Asymptotic-Statistics-Statistical-Probabilistic-Mathematics/dp/0521784506
+Asymptotic Statistics
+
+
+
+http://www.amazon.com/Large-Scale-Inference-Estimation-Prediction-Mathematical/dp/110761967X
+Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction
+
+
+
diff --git a/awesome/manifold-learning.md b/awesome/manifold-learning.md
new file mode 100644
index 0000000..1ec4d33
--- /dev/null
+++ b/awesome/manifold-learning.md
@@ -0,0 +1,30 @@
+讨论与进展 issue 26 https://github.com/memect/hao/issues/26
+
+## Introduction
+
+http://blog.sina.com.cn/s/blog_eccca60e0101h1d6.html @cmdyz 流形学习 (Manifold Learning)
+
+http://blog.pluskid.org/?p=533 浅谈流形学习
+
+http://blog.csdn.net/chl033/article/details/6107042 流形学习(manifold learning)综述
+
+http://colah.github.io/posts/2014-03-NN-Manifolds-Topology/ Neural Networks, Manifolds, and Topology
+
+# Tutorial
+
+http://www.cad.zju.edu.cn/reports/%C1%F7%D0%CE%D1%A7%CF%B0.pdf 何晓飞 流形学习
+
+https://www.cs.cmu.edu/~efros/courses/AP06/presentations/ThompsonDimensionalityReduction.pdf
+
+http://mlsp2012.conwiz.dk/fileadmin/lectures/mlsp2012_raich.pdf MLSP2012 Tutorial: Manifold Learning: Modeling and. Algorithms
+
+# Additional Tutorials
+
+http://www2.imm.dtu.dk/projects/manifold/Syllabus.html Summer School on Manifold Learning in Image and Signal Analysis
+
+## Implementation
+
+http://scikit-learn.org/stable/modules/manifold.html
+
+谁还关注这个话题: @王斌_ICTIR @丕子
+
diff --git a/awesome/mlss.md b/awesome/mlss.md
new file mode 100644
index 0000000..b5bad3d
--- /dev/null
+++ b/awesome/mlss.md
@@ -0,0 +1,42 @@
+# MLSS Machine Learning Summer Schools
+ (forked from http://www.mlss.cc/) adding more links to the list
+
+## highlights
+* 特别推荐09年UK的MLSS 所有还幻灯片 [打包下载ZIP 51M](http://mlg.eng.cam.ac.uk/mlss09/mlss_slides.zip) @bigiceberg 推荐 "其中09年UK的mlss最经典"
+
+## Future (8)
+* MLSS Spain (Fernando Perez-Cruz), late spring 2016 (tentative)
+* MLSS London (tentative)
+* MLSS Tübingen, summer 2017 (tentative)
+* MLSS Africa (very tentative)
+* MLSS Kyoto (Marco Cuturi, Masashi Sugiyama, Akihiro Yamamoto), August 31 - September 11 (tentative), 2015
+* MLSS Tübingen (Michael Hirsch, Philipp Hennig, Bernhard Schölkopf), July 13-24, 2015
+* MLSS Sydney (Edwin Bonilla, Yang Wang, Bob Williamson), 16 - 25 February, 2015 http://www.nicta.com.au/research/machine_learning/mlss2015
+* MLSS Austin (Peter Stone, Pradeep Ravikumar), January 7-16, 2015 http://www.cs.utexas.edu/mlss/
+
+## Past (25)
+* MLSS China, Beijing (Stephen Gould, Hang Li, Zhi-Hua Zhou), June 15-21, 2014, colocated with ICML http://lamda.nju.edu.cn/conf/mlss2014/
+* MLSS Pittsburgh (Alex Smola & Zico Kolter), July 6-18, 2014 http://mlss2014.com/
+* MLSS Iceland (Sami Kaski), April 26 - May 4, 2014 (colocated with AISTATS) http://mlss2014.hiit.fi/
+* MLSS Tübingen, Germany, 26 August - 07 September 2013 http://mlss.tuebingen.mpg.de
+* MLSS Kyoto, August 27 - September 7, 2012 http://www.i.kyoto-u.ac.jp/mlss12/
+* MLSS Santa Cruz, July 9-20, 2012 http://mlss.soe.ucsc.edu/home
+* MLSS La Palma, Canary Islands, April 11-19, 2012 (followed by AISTATS) http://mlss2012.tsc.uc3m.es/
+* MLSS France, September 4 - 17, 2011 http://mlss11.bordeaux.inria.fr/
+* MLSS @Purdue, June 13 and June 24, 2011 http://learning.stat.purdue.edu/wiki/mlss/start
+* MLSS Singapore, June 13 - 17, 2011 http://bigbird.comp.nus.edu.sg/pmwiki/farm/mlss/
+* MLSS Canberra, Australia, September 27 - October 6, 2010 http://canberra10.mlss.cc
+* MLSS Sardinia, May 6 - May 12, 2010 http://www.sardegnaricerche.it/index.php?xsl=370&s=139254&v=2&c=3841 [video lecture](http://videolectures.net/mlss2010_sardinia/)
+* MLSS Cambridge, UK, August 29 - September 10, 2009 http://mlg.eng.cam.ac.uk/mlss09
+* MLSS Canberra, Australia, January 26 - February 6, 2009 http://ssll.cecs.anu.edu.au/
+* MLSS Isle de Re, France, September 1-15, 2008 [archive](https://web.archive.org/web/20080329172541/http://mlss08.futurs.inria.fr/) [announcement](http://eventseer.net/e/7178/)
+* MLSS Kioloa, Australia, March 3 - 14, 2008 http://kioloa08.mlss.cc
+* MLSS Tübingen, Germany, August 20 - August 31, 2007 http://videolectures.net/mlss07_tuebingen/
+* MLSS Taipei, Taiwan, July 24 - August 2, 2006 http://www.iis.sinica.edu.tw/MLSS2006/
+* MLSS Canberra, Australia, February 6-17, 2006 http://canberra06.mlss.cc/
+* MLSS Chicago, USA, May 16-27, 2005 [archive](https://web.archive.org/web/20080314055344/http://chicago05.mlss.cc/) [announcement](http://linguistlist.org/LL/fyi/fyi-details.cfm?submissionid=49210)
+* MLSS Canberra, Australia, January 23 - February 5, 2005 [archive](https://web.archive.org/web/20060105025204/http://canberra05.mlss.cc/)
+* MLSS Berder, France, September 12-25, 2004 [archive](https://web.archive.org/web/20080406175615/http://www.kyb.tuebingen.mpg.de/mlss04/)
+* MLSS Tübingen, Germany, August 4-16, 2003 [archive](https://web.archive.org/web/20080409113424/http://www.kyb.tuebingen.mpg.de/mlss04/mlss03/)
+* MLSS Canberra, Australia, February 2-14, 2003 [archive](https://web.archive.org/web/20030607005801/http://mlg.anu.edu.au/summer2003/)
+* MLSS Canberra, Australia, February 11-22, 2002 [archive](https://web.archive.org/web/20030607063738/http://mlg.anu.edu.au/summer2002/)
diff --git a/awesome/multiclass-boosting.md b/awesome/multiclass-boosting.md
new file mode 100644
index 0000000..8878c21
--- /dev/null
+++ b/awesome/multiclass-boosting.md
@@ -0,0 +1,52 @@
+#Awesome Multi-class Boosting Resources
+
+abstract: classic papers, slides and overviews, plus Github code.
+
+
+
+(image source http://www.svcl.ucsd.edu/projects/)
+
+chinese abstract: 问:@图像视觉研究 有没有经典的Multi-Class boosting的相关资料推荐推荐? 答:找到几篇经典论文,几个幻灯片、录像以及工具包。相关学校有MIT,UCSD,Stanford,umich等。软件有C++, Pythton (scikit-learn) 实现,也有几个GITHUB开源软件。 [资料卡片](http://bigdata.memect.com/?tag=MultiClassBoosting)
+
+https://github.com/memect/hao/blob/master/awesome/multiclass-boosting.md
+
+# overview
+http://www.svcl.ucsd.edu/projects/mcboost/
+
+http://classes.soe.ucsc.edu/cmps242/Fall09/proj/Mario_Rodriguez_Multiclass_Boosting_talk.pdf Multi-class boosting (slides), Mario Rodriguez, 2009
+
+http://cmp.felk.cvut.cz/~sochmj1/adaboost_talk.pdf presentation summarizing AdaBoost
+
+
+# people
+
+http://dept.stat.lsa.umich.edu/~jizhu/ check his contribution on SAMME
+
+
+#video lectures
+
+https://www.youtube.com/watch?v=L6BlpGnCYVg "A Theory of Multiclass Boosting", Rob Schapire, Partha Niyogi Memorial Conference: Computer Science
+
+http://techtalks.tv/talks/multiclass-boosting-with-hinge-loss-based-on-output-coding/54338/ Multiclass Boosting with Hinge Loss based on Output Coding, Tianshi Gao; Daphne Koller, ICML 2011
+
+# classical paper
+http://web.mit.edu/torralba/www/cvpr2004.pdf Sharing features: efficient boosting procedures for multiclass object detection, Antonio Torralba Kevin P. Murphy William T. Freeman, CVPR 2004
+
+
+http://dept.stat.lsa.umich.edu/~jizhu/pubs/Zhu-SII09.pdf Multi-class AdaBoost, Ji Zhu, Hui Zou, Saharon Rosset and Trevor Hastie, Statistics and Its Interface, 2009
+
+http://www.cs.princeton.edu/~imukherj/nips10.pdf A Theory of Multiclass Boosting, Indraneel Mukherjee, Robert E. Schapire, NIPS 2010
+
+http://papers.nips.cc/paper/4450-multiclass-boosting-theory-and-algorithms.pdf Multiclass Boosting: Theory and Algorithms, Mohammad J. Saberian, Nuno Vasconcelos, NIPS, 2011
+
+
+# tools
+http://www.multiboost.org/ a fast C++ implementation of multi-class/multi-label/multi-task boosting algorithms. It is based on AdaBoost.MH but also implements popular cascade classifiers and FilterBoost along with a batch of common multi-class base learners (stumps, trees, products, Haar filters).
+
+http://scikit-learn.org/stable/auto_examples/ensemble/plot_adaboost_multiclass.html
+
+https://github.com/cshen/fast-multiboost-cw
+
+https://github.com/pengsun/AOSOLogitBoost
+
+https://github.com/circlingthesun/omclboost
diff --git a/awesome/multitask-learning.md b/awesome/multitask-learning.md
new file mode 100644
index 0000000..4ede970
--- /dev/null
+++ b/awesome/multitask-learning.md
@@ -0,0 +1,104 @@
+# MultiTask Learning 资源合集
+
+contributors: 唐小sin 王威廉 黄厝海滨 李航博士 李沐M Copper_PKU 复旦李斌 eeyangc 李晗littlefool 李亚超NLP lby9
+
+discussion: https://github.com/memect/hao/issues/93
+
+keywords
+ multi-task learning
+
+## 微博讨论
+问: @唐小sin 有没有multi-task learning的相关学习资料呢?
+答: 维基百科上有不少经典文献。AAAI和ICML都有论文(北大/清华)。找到今年Honglak Lee (U Michigan 教授)的短教程。Lan Žagar 博士论文(2014) Ranking by Multitask Learning. 问答追踪: #93 求补充
+http://www.weibo.com/5220650532/BiZl47k80?ref=
+
+唐小sin:补充下吧,刚自己也找了一遍classic paper里面的Caruana的博士论文就是Multitask Learning,他是Tom Mitchell的学生。
+
+
+
+王威廉:今年SIGKDD最佳博士论文颁给了CMU计算机系金光熹同学的论文 Reconstruction and Applications of Collective Storylines from Web Photo Collections http://t.cn/RPNmgEw 还有一个优胜奖也由CMU的multitask learning论文(Mladen Kolar,现芝大教授)获得。
+http://weibo.com/1657470871/BhG9eDbcm
+
+黄厝海滨:可以说说他的导师啊,因为这两者的导师都是Eric Xing (8月10日 22:42)
+
+
+
+
+李航博士 :#WSDM2014# Best paper award: Amr Ahmed, Abhimanyu Das, Alex Smola, Hierarchical multitask learning: scalable algorithms and an application to conversion optimization in display advertising
+http://weibo.com/2060750830/AyJKFeZmQ
+
+李沐M :恭喜小伙伴和老板。这篇文章先被拒了一次,然后狠下心好好改了改写作。然后就happy ending了。老板然后眨着眼说,你懂了吗?我问懂神码?一呢,写作很重要,二呢,我写作很糟糕,你不能太依靠了。。。 (2月28日 03:53)
+
+
+Copper_PKU:six NLP Task from Ronan Collobert, Jason Weston. A Unified Architecture for Natural Language Processing:Deep Neural Networks with Multitask Learning. ICML. 2008....畅读版【http://t.cn/8FOioh1】
+http://weibo.com/1758509357/AwFYMa0ot
+
+
+复旦李斌:最右说的应该就是vowpal wabbit中使用的feature hash方法,Ping Li每篇论文都会提到这个,Smola在ICML-09把这个方法用multitask learning,我也把这个方法用于graph控制特征维度。//@鲁东东胖: 有没有具体一点的描述啊 //@夏粉_百度: 在那次Adworkshop上,yahoo介绍了另外一种降维方法,通过hash的方法
+http://weibo.com/2303649634/A83kaktRT
+
+
+eeyangc:从生物角度,你可以说是共同的遗传作用;从machine learning角度看,你可以看成multitask learning;从统计学角度看,你可以说是random-effects and hierarchical structures。横看成岭侧成峰,远近高低各不同。
+http://weibo.com/2107700352/A4CuScVmV
+
+
+
+李晗littlefool:deep learning造冗余特征的思路不错,boosted decision tree 和 kernel svm 现在有用但是有其局限性。坚持我的观点 基于deep learning的无监督特征工程,和现有的非线性模型。配以online learning的实时特征抽取和模型更新,并借用multitask和transfer learning的知识来进行信息扩展和加强问题适用性。
+http://weibo.com/1489962750/zp3daxlC6
+
+李亚超NLP:A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning http://t.cn/aued1i
+http://weibo.com/1732906091/zjTJ94IaH
+
+lby9:1) Deep learning在文本中的应用比较有意思的是这篇《A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning》。基本上网络结构是底层的low level features是共享的,上层的任务(POS, Chunking, NER等)共享部分的底层feature。网络结构如图。
+http://weibo.com/1873273890/zhvrbkS8c
+
+
+## overview and survey
+http://en.wikipedia.org/wiki/Multi-task_learning
+
+https://sites.google.com/site/deeplearningcvpr2014/DL-Multimodal_multitask_learning.pdf Multimodal learning and multitask learning (2014)
+
+http://www.siam.org/meetings/sdm12/zhou_chen_ye.pdf Multi-Task Learning: Theory, Algorithms, and Applications (2012, SDM tutorial)
+
+http://jcse.kiise.org/files/JCSE-V5N3-09.pdf A Survey of Transfer and Multitask Learning in Bioinformatics (2009, JCSE)
+
+http://www.cse.wustl.edu/~kilian/research/multitasklearning/multitasklearning.html
+Multitask Learning / Domain Adaptation related publications, maintained by Prof. Kilian Q. Weinberger
+
+## classic paper
+http://www.eecs.berkeley.edu/~russell/classes/cs294/f05/papers/caruana-1997.pdf Caruana, R. (1997). Multitask learning: A knowledge-based source of inductive bias. Machine Learning
+
+http://www.thespermwhale.com/jaseweston/papers/unified_nlp.pdf
+Ronan Collobert and Jason Weston. 2008. A unified architecture for natural language processing: deep neural networks with multitask learning. In Proceedings of the 25th international conference on Machine learning (ICML '08)
+* Copper_PKU, 李亚超NLP, lby9 共同推荐
+
+## current
+http://research.microsoft.com/pubs/210041/wsdm2014-multitask.pdf
+Amr Ahmed, Abhimanyu Das, Alex Smola, Hierarchical multitask learning: scalable algorithms and an application to conversion optimization in display advertising
+* 李航博士 :#WSDM2014# Best paper award
+
+http://www.aaai.org/ocs/index.php/AAAI/AAAI14/paper/download/8486/8820 Encoding Tree Sparsity in Multi-Task Learning: A Probabilistic Framework (2014) AAAI
+
+http://machinelearning.wustl.edu/mlpapers/paper_files/icml2014c2_lic14.pdf Bayesian Max-margin Multi-Task Learning with Data Augmentation , (2014) ICML
+
+http://link.springer.com/chapter/10.1007/978-3-642-37331-2_1 Beyond Dataset Bias: Multi-task Unaligned Shared Knowledge Transfer (2013)
+
+## thesis
+http://repository.cmu.edu/dissertations/229/
+Uncovering Structure in High-Dimensions: Networks and Multi-task Learning Problems
+(2013) Mladen Kolar, PhD Thesis
+* 王威廉 推荐, KDD 2014 dissertation award Honorable mention http://www.kdd.org/blog/2014-doctoral-dissertation-award
+
+http://eprints.fri.uni-lj.si/2486/
+Lan Žagar (2014) Ranking by Multitask Learning. PhD thesis.
+
+http://gogoshen.org/ml/Research%20Paper%20Library/caruana97multitask2.pdf
+Caruana, (1997) Multitask Learning, PhD Thesis
+* 唐小sin:补充下吧,刚自己也找了一遍classic paper里面的Caruana的博士论文就是Multitask Learning,他是Tom Mitchell的学生。
+
+## related
+http://burrsettles.com/pub/settles.activelearning.pdf Active Learning Literature Survey, Burr Settles (2010) 1000+ citation
+
+http://bigdata.memect.com/?s=multitask
+
+
diff --git a/awesome/nlp.md b/awesome/nlp.md
new file mode 100644
index 0000000..8c4d580
--- /dev/null
+++ b/awesome/nlp.md
@@ -0,0 +1,308 @@
+# NLP常用信息资源
+
+## resource portal
+http://nlp.hivefire.com/ NLP News
+
+https://nlppeople.com/ NLP Jobs
+
+http://www.cs.rochester.edu/~tetreaul/conferences.html Computational Linguistics / NLP Conferences
+
+http://www.ldc.upenn.edu/ LDC: The Linguistic Data Consortium
+
+http://www.clt.gu.se/wiki/nlp-resources NLP Resources
+
+http://www.aaai.org/AITopics/html/natlang.html AAAI Topics on NLP
+
+http://www-nlp.stanford.edu/links/statnlp.html Statistical natural language processing and corpus-based computational linguistics: An annotated list of resources
+
+http://wordnet.princeton.edu/ WordNet
+
+http://www.keenage.com/ 知网
+
+http://www.corpus4u.org/ 语料库语言学在线
+
+
+http://trec.nist.gov/ TREC
+* The Text REtrieval Conference (TREC), co-sponsored by the National Institute of Standards and Technology (NIST) and U.S. Department of Defense, was started in 1992 as part of the TIPSTER Text program.
+
+## tutorial
+http://nlp.cs.berkeley.edu/tutorials/variational-tutorial-slides.pdf Variational Inference in Structured NLP Models, Presented at NAACL 2012 with David Burkett.
+
+http://pages.cs.wisc.edu/~jerryzhu/pub/ZhuCCFADL46.pdf Tutorial on Statistical Machine Learning for NLP 2013
+
+
+## courses
+http://www.stanford.edu/class/cs224n/ CS 224N / Ling 284 — Natural Language Processing
+
+http://www.cs.berkeley.edu/~klein/cs288/sp10/ CS 288: Statistical Natural Language Processing, Spring 2010
+
+
+http://demo.clab.cs.cmu.edu/fa2013-11711/index.php/Main_Page Algorithms for NLP: Basic Information (Fall 2013)
+
+http://www.cs.colorado.edu/~martin/csci5832/lectures_and_readings.html Natural Language Processing, CSCI 5832 FALL 2013
+
+http://www.cs.columbia.edu/~cs4705/ COMS W4705: Natural Language Processing 2013
+
+http://www1.cs.columbia.edu/~julia/courses/CS4705/syllabus10.htm COMS 4705: Natural Language Processing, Fall 2010
+
+http://www1.cs.columbia.edu/~julia/courses/CS4706/syllabus12.htm CS4706: Spoken Language Processing, Spring 2012
+
+http://www.cs.cornell.edu/courses/cs4740/2014sp/ CS 4740/5740 - Introduction to Natural Language Processing, Spring 2014
+
+http://l2r.cs.uiuc.edu/~danr/Teaching/CS546-13/ Machine Learning and Natural Language Spring 2013
+
+http://www.cs.jhu.edu/~jason/465/ Natural Language Processing Course # 600.465 — Fall 2013
+
+http://web.stanford.edu/class/cs224s/ CS 224S/LINGUIST 285 Spoken Language Processing
+
+http://www.umiacs.umd.edu/~resnik/ling773_sp2014/ Ling773/CMSC773/INST728C, Spring 2014 Computational Linguistics II
+
+http://cs.nyu.edu/courses/spring13/CSCI-GA.2590-001/index.html
+
+http://www.cis.upenn.edu/~cis530/ CIS 530 Fall 2013 Computational Linguistics
+
+http://pages.cs.wisc.edu/~jerryzhu/cs769.html CS 769: Advanced Natural Language Processing Spring 2010
+
+http://pages.cs.wisc.edu/~bsnyder/cs769.html
+
+
+
+## group
+http://nlp.stanford.edu/ Stanford NLP group
+
+http://nlp.cs.berkeley.edu/ Berkeley NLP group
+
+http://www.lti.cs.cmu.edu/ CMU Language Technologies Institute
+
+http://nlp.ict.ac.cn/index_zh.php 中科院计算所自然语言处理研究组
+
+http://www.sogou.com/labs/ Sogou实验室
+
+http://linguistics.georgetown.edu/ Department of Linguistics, Georgetown University
+
+http://ir.hit.edu.cn/ 哈工大社会计算与信息检索研究中心
+
+http://www.childrenshospital.org/research-and-innovation/research-labs/natural-language-processing-lab
+
+https://wiki.umiacs.umd.edu/clip/index.php/Main_Page
+
+http://nlp.cs.nyu.edu/
+
+http://nlp.cis.upenn.edu/
+
+http://www.eng.utah.edu/~cs5340/
+
+
+## Textbook
+http://www.cs.colorado.edu/~martin/slp2.html SPEECH and LANGUAGE PROCESSING 2nd edition 2009
+* 浔雨: "自然语言处理综论" 这本书的权威自不用说,译者是冯志伟老师和孙乐老师,当年读这本书的时候,还不知道冯老师是谁,但是读起来感觉非常好,想想如果没有在这个领域积攒多年的实力,是不可能翻译的这么顺畅的。这本书在国内外的评价都比较好,对自然语言处理的两个学派(语言学派和统计学派)所关注的内容都有所包含,但因此也失去一些侧重点。从我的角度来说更偏向于统计部分,所以需要了解统计
+
+http://cognet.mit.edu/library/books/view?isbn=0262133601 Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999.
+* http://www.csd.uwo.ca/~olga/Courses//Winter2010//CS4442_9542b/Books/StatNatLangProc/
+
+
+## people
+http://nlp.stanford.edu/~manning/
+
+http://www.umiacs.umd.edu/~hal/
+
+http://mimno.infosci.cornell.edu/ David Mimno
+* maintainer of MALLET
+
+
+http://www.cs.berkeley.edu/~klein/ Dan Klein
+
+http://cs.brown.edu/people/ec/home.html Eugene Charniak
+
+http://www.cs.colorado.edu/~martin/
+
+http://www.cs.columbia.edu/~mcollins/
+
+http://www1.cs.columbia.edu/~julia/
+
+http://www.cs.cornell.edu/home/cardie/
+
+http://www.eecs.harvard.edu/shieber/
+* computational Linguistics
+
+http://l2r.cs.uiuc.edu/~danr/
+
+http://www.cs.jhu.edu/~jason/
+
+http://www.stanford.edu/~jurafsky/
+
+http://www.umiacs.umd.edu/~resnik/
+
+http://cs.nyu.edu/grishman/
+
+http://homes.cs.washington.edu/~taskar/
+
+http://www.cis.upenn.edu/~nenkova/
+
+http://www.cs.utah.edu/~riloff/
+
+http://pages.cs.wisc.edu/~jerryzhu/
+
+http://pages.cs.wisc.edu/~bsnyder/
+
+http://www.cs.cmu.edu/~nasmith/
+
+http://www.cs.cmu.edu/~alavie/
+
+
+
+# Tools
+## NLP Toolbox
+http://gate.ac.uk GATE
+* 孔牧: 你可以按照它的要求向其中添加组件, 完成自己的nlp任务. 我在的项目组曾经尝试过使用, 虽然它指出组件开发, 但是灵活性还是不高, 所以我们自己又开发了一套流水线。
+
+http://nltk.org Natural Language Toolkit(NLTK)
+
+http://mallet.cs.umass.edu MALLET MAchine Learning for LanguagE Toolkit
+
+
+http://opennlp.apache.org/ OpenNLP
+
+http://alias-i.com/lingpipe/ LingPipe is tool kit for processing text using computational linguistics.
+
+https://textblob.readthedocs.org/en/dev/ TextBlob: Simplified Text Processing (python)
+
+https://github.com/HIT-SCIR/ltp 语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。
+* http://www.ltp-cloud.com/ “语言技术平台云”(LTP-Cloud)
+* 孔牧: 这个是一个较完善的流水线了, 不说质量怎么样, 它提供分词、语义标注、 句法依赖、 实体识别。 虽然会出现错误的结果, 但是, 找不到更好的了。
+
+https://github.com/xpqiu/fnlp/ 中文自然语言处理工具包
+* 邱锡鹏: 推荐自家的FudanNLP
+
+
+## English Stemmer
+http://snowball.tartarus.org/ Snowball
+
+## English POS Tagger
+http://nlp.stanford.edu/software/tagger.shtml Stanford POS Tagger
+
+http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/ TreeTagger
+
+http://www.coli.uni-saarland.de/~thorsten/tnt/ TnT
+
+## Parser
+http://nlp.stanford.edu/software/lex-parser.shtml Stanford Parser
+
+http://nlp.cs.berkeley.edu/software.shtml Berkeley Parser
+
+https://github.com/BLLIP/bllip-parser Copyright Mark Johnson, Eugene Charniak, 24th November 2005 --- August 2006
+
+## English Keyphrase Extractor
+http://www.nzdl.org/Kea/index_old.html KEA keyphrase extraction
+
+## English Name Entity Recognizer
+http://nlp.stanford.edu/software/CRF-NER.shtml Stanford NER
+
+## Chinese Word Segmentation
+http://nlp.stanford.edu/software/segmenter.shtml Stanford Word Segmenter
+
+https://github.com/fxsjy/jieba 中文分词
+
+http://ictclas.org/ 中科院分词ICTCLAS
+* 孔牧: 一个比较权威的分词器, 相信你最后会选择它作为项目的分词工具, 虽然本身存在很多问题, 但是我找不到更好的开源项目了。
+
+http://msdn.microsoft.com/zh-cn/library/jj163981.aspx
+* 孔牧: 当然这个是不开源的, 但是分词非常准, 但是悲剧的是它将分词和实体识别同时完成了, 而且分词(在它提供的工具中)不提供词性标注。
+
+https://github.com/ansjsun/ansj_seg ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
+
+## speech recognition
+http://cmusphinx.sourceforge.net/ CMU Sphinx
+
+
+## Topic Modeling Tools
+http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm Matlab Topic Modeling Toolbox 1.4
+
+http://gibbslda.sourceforge.net/ GibbsLDA++
+
+http://code.google.com/p/glda/ GLDA GPU-accelerated Latent Dirichlet allocation training
+
+## Search Engines
+http://lucene.apache.org/ Lucene
+
+
+# classic papers
+
+
+## Chinese Word Segmentaion
+http://zhangkaixu.github.io/bibpage/cws.html 张开旭同学整理的文献列表
+
+## Information Extraction
+(2008) Sunita Sarawagi. Information extraction. Foundations and Trends in Databases.
+
+## Language Model
+(2000) Rosenfeld, R. Two decades of statistical language modeling: where do we go from here?. Proc. IEEE.
+(2009) Chengxiang Zhai. Statistical Language Models For information Retrieval. Lecture Notes.
+http://www.cs.cmu.edu/~roni/papers/survey-slm-IEEE-PROC-0004.pdf Two decades of Statistical Language Models
+
+## Parsing
+(2009) Sandra Kubler, Ryan McDonald, Joakim Nivre. Dependency Parsing. Synthesis Lectures on Human Language Technologies.
+
+## Sentiment Analysis and Opinion Mining
+(2008) Bo Pang and Lillian Lee. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval .
+
+## Word Sense Disambiguation
+(2009) Navigli, R. Word sense disambiguation: A survey. ACM Computing Surveys.
+
+## Topic Models
+http://mimno.infosci.cornell.edu/topics.html Topic modeling bibliography
+
+
+Parsing(句法结构分析~语言学知识多,会比较枯燥)
+
+ Klein & Manning: "Accurate Unlexicalized Parsing" ( )
+ Klein & Manning: "Corpus-Based Induction of Syntactic Structure: Models of Dependency and Constituency" (革命性的用非监督学习的方法做了parser)
+ Nivre "Deterministic Dependency Parsing of English Text" (shows that deterministic parsing actually works quite well)
+ McDonald et al. "Non-Projective Dependency Parsing using Spanning-Tree Algorithms" (the other main method of dependency parsing, MST parsing)
+
+
+Machine Translation(机器翻译,如果不做机器翻译就可以跳过了,不过翻译模型在其他领域也有应用)
+
+ Knight "A statistical MT tutorial workbook" (easy to understand, use instead of the original Brown paper)
+ Och "The Alignment-Template Approach to Statistical Machine Translation" (foundations of phrase based systems)
+ Wu "Inversion Transduction Grammars and the Bilingual Parsing of Parallel Corpora" (arguably the first realistic method for biparsing, which is used in many systems)
+ Chiang "Hierarchical Phrase-Based Translation" (significantly improves accuracy by allowing for gappy phrases)
+
+
+Language Modeling (语言模型)
+
+ Goodman "A bit of progress in language modeling" (describes just about everything related to n-gram language models 这是一个survey,这个survey写了几乎所有和n-gram有关的东西,包括平滑 聚类)
+ Teh "A Bayesian interpretation of Interpolated Kneser-Ney" (shows how to get state-of-the art accuracy in a Bayesian framework, opening the path for other applications)
+
+
+Machine Learning for NLP
+
+ Sutton & McCallum "An introduction to conditional random fields for relational learning" (CRF实在是在NLP中太好用了!!!!!而且我们大家都知道有很多现成的tool实现这个,而这个就是一个很简单的论文讲述CRF的,不过其实还是蛮数学= =。。。)
+ Knight "Bayesian Inference with Tears" (explains the general idea of bayesian techniques quite well)
+ Berg-Kirkpatrick et al. "Painless Unsupervised Learning with Features" (this is from this year and thus a bit of a gamble, but this has the potential to bring the power of discriminative methods to unsupervised learning)
+
+Information Extraction
+
+ Hearst. Automatic Acquisition of Hyponyms from Large Text Corpora. COLING 1992. (The very first paper for all the bootstrapping methods for NLP. It is a hypothetical work in a sense that it doesn't give experimental results, but it influenced it's followers a lot.)
+ Collins and Singer. Unsupervised Models for Named Entity Classification. EMNLP 1999. (It applies several variants of co-training like IE methods to NER task and gives the motivation why they did so. Students can learn the logic from this work for writing a good research paper in NLP.)
+
+Computational Semantics
+
+ Gildea and Jurafsky. Automatic Labeling of Semantic Roles. Computational Linguistics 2002. (It opened up the trends in NLP for semantic role labeling, followed by several CoNLL shared tasks dedicated for SRL. It shows how linguistics and engineering can collaborate with each other. It has a shorter version in ACL 2000.)
+ Pantel and Lin. Discovering Word Senses from Text. KDD 2002. (Supervised WSD has been explored a lot in the early 00's thanks to the senseval workshop, but a few system actually benefits from WSD because manually crafted sense mappings are hard to obtain. These days we see a lot of evidence that unsupervised clustering improves NLP tasks such as NER, parsing, SRL, etc,
+
+# Reference
+1. http://www.newsmth.net/nForum/#!article/NLP/43 zibuyu (得之我幸失之我命), NLP常用信息资源, 水木社区 (Wed Mar 14 23:56:43 2007)
+
+2. http://www.newsmth.net/nForum/#!article/NLP/3849 zibuyu (得之我幸失之我命), NLP常用开源/免费工具, 水木社区 (Wed Mar 14 23:56:43 2007)
+
+3. http://www.newsmth.net/nForum/#!article/NLP/5461 zibuyu (得之我幸失之我命), NLP领域经典综述, 水木社区 (Tue Feb 24 11:13:53 2009)
+
+4. http://www.zhihu.com/question/19929473 "目前常用的自然语言处理开源项目/开发包有哪些?" 孔牧, 邱锡鹏, 裴飞, 贺一帆 武博文
+
+
+5. http://www.zhihu.com/question/19895141 "自然语言处理怎么最快入门?"
+
+
+
+
diff --git a/awesome/ocr-tools.md b/awesome/ocr-tools.md
new file mode 100644
index 0000000..506eca5
--- /dev/null
+++ b/awesome/ocr-tools.md
@@ -0,0 +1,57 @@
+极客杨的OCR工具箱:Tesseract 是目前应用最广泛的免费开源OCR工具(背后有Google的支持)。商业产品有ABBYY的finereader,还有Adobe;国产的有文通和汉王。当前热点是将OCR移植到智能手机上拓展新的输入渠道、IOS有基于Tesseract的实现,Android有高通vuforia API。
+
+识别效率高低的关键还是调参数,主要两点:不同的语言有不同的初始设置; 有颜色或渐进的背景会极大降低识别准确率,需要先转换成黑白/灰度模式(可以试试OpenCV)。 推荐看两篇文章,一篇是Tesseract简介(2007),另一篇报告了Tesseract在处理彩色图片中遇到的问题。
+
+资料卡片流: http://hao.memect.com/?tag=ocr-tools
+
+
+[](http://hao.memect.com/?tag=ocr-tools)
+
+# Top Reading - Market Survey
+https://tesseract-ocr.googlecode.com/files/TesseractOSCON.pdf Tesseract features and key issues (2007)
+
+http://www.assistivetechnology.vcu.edu/files/2013/09/pxc3882784.pdf Optical Character Recognition by Open Source OCR
+Tool Tesseract: A Case Study (2012)
+
+http://lifehacker.com/5624781/five-best-text-recognition-tools
+
+http://www.zhihu.com/question/19593313
+
+http://www.perfectgeeks.com/list/top-best-free-ocr-software/13
+
+http://lib.psnc.pl/Content/358/PSNC_Tesseract-FineReader-report.pdf Report on the comparison of Tesseract and
+ABBYY FineReader OCR engines (2012)
+
+
+# best OCR tools
+https://code.google.com/p/tesseract-ocr/ mostly used open source ocr software. apache 2.0. It has been improved extensively by Google
+
+http://finereader.abbyy.com/ one of the best commercial product
+
+http://www.wintone.com.cn/en/ one of the best commercial product for Chinese
+
+# Tesseract in action and Q/A
+http://benschmidt.org/dighist13/?page_id=129
+
+http://stackoverflow.com/questions/13511102/ios-tesseract-ocr-image-preperation
+
+http://stackoverflow.com/questions/9480013/image-processing-to-improve-tesseract-ocr-accuracy?rq=1
+
+http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-version
+
+
+
+# Tesseract related applications
+https://github.com/gali8/Tesseract-OCR-iOS
+
+https://github.com/rmtheis/android-ocr
+
+https://github.com/rmtheis/tess-two
+
+
+# misc
+
+https://developer.vuforia.com/resources/sample-apps/text-recognition
+https://www.youtube.com/watch?v=KLqFQ2u52iU
+
+http://blog.ayoungprogrammer.com/2013/01/equation-ocr-part-1-using-contours-to.html
diff --git a/awesome/opendata-gbif.md b/awesome/opendata-gbif.md
new file mode 100644
index 0000000..8682121
--- /dev/null
+++ b/awesome/opendata-gbif.md
@@ -0,0 +1,10 @@
+http://www.gbif.org/mendeley/usecases research papers
+
+http://www.gbif.org/newsroom/uses showcases using aggregated data
+
+http://imsgbif.gbif.org/CMS_ORC/?doc_id=2613&download=1 2014 overview
+
+http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0066559 research paper on grey squirrel
+
+http://www.gbif.org/ homepage
+
diff --git a/awesome/outlier-text-mining.md b/awesome/outlier-text-mining.md
new file mode 100644
index 0000000..a51b783
--- /dev/null
+++ b/awesome/outlier-text-mining.md
@@ -0,0 +1,65 @@
+# Outlier Detection in Text Mining
+
+contributor: 郭惠礼 , 许扬逸Dijkstra , phunter_lau , ai_东沂
+
+card list: http://bigdata.memect.com/?tag=outlierdetectionandtextmining
+
+https://github.com/memect/hao/blob/master/awesome/outlier-text-mining.md
+
+keywords:
+ outlier detection,
+ anomaly detection,
+ text mining
+
+## Outlier detection survey
+http://info.mapr.com/resources_anewlook_anomalydetection_ty.html.html?aliId=7992403
+@ 郭惠礼 :刚看完一本书. Practical Machine Learning: A New Look At Anomaly Detection. " http://t.cn/RPJX4YT 一本免费的机器学习实践书。此书主要以Anomaly Detection与T-digest算法为主轴展开论述, 不涉及太深的知识。 比较简单,适合刚接触ML的初学者.
+
+http://arxiv.org/abs/1009.6119 A Comprehensive Survey of Data Mining-based Fraud Detection Research, Clifton Phua, Vincent Lee, Kate Smith, Ross Gayler 2010
+
+http://www.kdnuggets.com/2014/05/book-outlier-detection-temporal-data.html Outlier Detection for Temporal Data (Book)
+
+http://en.wikipedia.org/wiki/Anomaly_detection
+
+http://www.siam.org/meetings/sdm10/tutorial3.pdf Outlier Detection Techniques - SIAM
+
+http://www.slideshare.net/HouwLiong/chapter-12-outlier
+
+
+## Outlier/anomaly detection in Text mining
+
+http://nlp.shef.ac.uk/Completed_PhD_Projects/guthrie.pdf David Guthrie, Unsupervised Detection of Anomalous Text
+来自UK Shef大学的博士论文
+
+http://link.springer.com/chapter/10.1007%2F978-1-4614-6396-2_7 Aggarwal的outlier analysis一书的chapter 7 Outlier Detection in Categorical, Text and Mixed Attribute Data
+
+
+http://www.amazon.com/Survey-Text-Mining-Clustering-Classification/dp/1848000456 Survey of Text Mining: Clustering, Classification, and Retrieval, Second Edition , Michael W. Berry and Malu Castellanos, Editors 2007 (check part IV Part IV Anomaly Detection) https://perso.uclouvain.be/vincent.blondel/publications/08-textmining.pdf
+
+http://www.mdpi.com/1999-4893/5/4/469 Contextual Anomaly Detection in Text Data 2012
+
+
+## Text mining (focus on topic models)
+http://www.itee.uq.edu.au/dke/filething/get/855/text-mining-ChengXiangZhai.pdf Statistical Methods for Mining Big Text Data, ChengXiang Zhai 2014
+
+http://cs.gmu.edu/~carlotta/publications/AlsumaitL_onlineLDA.pdf On-Line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and Tracking, Loulwah AlSumait, Daniel Barbar´a, Carlotta Domeniconi
+
+
+## 相关点评
+
+
+@phunter_lau:里面用到的技能也就是outlier detection然后根据outlier所在的几个表进行join,暴力搜索,这是常见手段
+http://weibo.com/1770891687/B5Gs7xdqQ
+
+phunter_lau:注意,下面这段话不是常规办法也没多少理论依据,不能误导大家:
+ "phunter_lau:也可以,并且对于非连通的情况可以随机加入连通,比如“你就是偷看那个妹子了”并继续分析有意想不到的结果"
+
+
+
+许扬逸Dijkstra: 在antispam,multidimension outlier detection上也可以试试它
+@计兮 【金融数据挖掘之朴素贝叶斯】by@数说工作室网站:本文介绍了金融数据挖掘过程中的朴素贝叶斯模型,供大家参考。原文链接→http://t.cn/RPzhx7S
+http://www.weibo.com/1642083541/Be9vDxvyw
+
+
+ai_东沂: 我补充一下之前搜到的资料,来自UK Shef大学的博士论文http://nlp.shef.ac.uk/Completed_PhD_Projects/guthrie.pdf
+Aggarwal的outlier analysis一书的chapter 7 Outlier Detection in Categorical, Text and Mixed Attribute Data,http://link.springer.com/chapter/10.1007%2F978-1-4614-6396-2_7
diff --git a/awesome/phonetic_algorithm.md b/awesome/phonetic_algorithm.md
new file mode 100644
index 0000000..8c8c5ab
--- /dev/null
+++ b/awesome/phonetic_algorithm.md
@@ -0,0 +1,53 @@
+# 语音相似度算法与代码
+讨论: https://github.com/memect/hao/issues/164
+
+
+## 概念
+[语音算法](http://en.wikipedia.org/wiki/Phonetic_algorithm) A phonetic algorithm is an algorithm for indexing of words by their pronunciation.
+
+相关关键字:
+ 语音相似度 phonetic similarity
+ 声音相似度 Acoustic similarity/Confusability
+
+
+## 算法与开源代码
+
+
+
+algorithms
+* Soundex
+ * Daitch–Mokotoff Soundex
+ * Kölner Phonetik
+* Metaphone
+ * Double Metaphone
+* New York State Identification and Intelligence System
+* Match Rating Approach (MRA)
+* Caverphone
+
+open source code
+* https://github.com/elasticsearch/elasticsearch-analysis-phonetic/ -- java
+* https://github.com/maros/Text-Phonetic -- perl
+* https://github.com/dotcypress/phonetics -- go
+* https://github.com/lukelex/soundcord -- ruby
+* https://github.com/Simmetrics/simmetrics -- java
+* https://github.com/oubiwann/metaphone - https://pypi.python.org/pypi/Metaphone/0.4 --python
+* https://bitbucket.org/yougov/fuzzy - https://pypi.python.org/pypi/Fuzzy/1.0 --python
+* https://github.com/sunlightlabs/jellyfish - https://pypi.python.org/pypi/jellyfish/0.3.2 -- python
+
+source: wikipedia, github
+
+## 相关论文
+
+http://saffron.insight-centre.org/acl/topic/phonetic_similarity/ 相关论文列表
+
+https://homes.cs.washington.edu/~bhixon/papers/phonemic_similarity_metrics_Interspeech_2011.pdf Phonemic Similarity Metrics to Compare Pronunciation Methods (2011)
+
+http://webdocs.cs.ualberta.ca/~kondrak/papers/lingdist.pdf Evaluation of Several Phonetic Similarity Algorithms on the Task of Cognate Identification (2006)
+
+http://webdocs.cs.ualberta.ca/~kondrak/papers/chum.pdf Phonetic alignment and similarity (2003)
+
+http://www.aclweb.org/anthology/C69-5701 THE Measurement OF PHONETIC SIMILARITY (1967)
+
+http://www.aclweb.org/anthology/P/P06/P06-1125.pdf A Phonetic-Based Approach to Chinese Chat Text Normalization 中文方法
+语音相似度 phonetic similarity 算法与开源代码
+
diff --git a/awesome/piecewise-linear-regression.md b/awesome/piecewise-linear-regression.md
new file mode 100644
index 0000000..44b6e00
--- /dev/null
+++ b/awesome/piecewise-linear-regression.md
@@ -0,0 +1,56 @@
+# 分段线性模型资料与软件-入门篇
+
+* contributors: @视觉动物晴木明川 @heavenfireray @禅系一之花
+* keywords: 分段线性模型, Piecewise linear regression, Segmented linear regression,
+* license: Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
+* cardbox: http://bigdata.memect.com/?tag=piecewiselinearregression
+* discussion: https://github.com/memect/hao/issues/70
+
+https://github.com/memect/hao/blob/master/awesome/piecewise-linear-regression.md
+
+
+## 教程
+
+https://onlinecourses.science.psu.edu/stat501/node/77 Piecewise linear regression models
+
+http://www.fs.fed.us/rm/pubs/rmrs_gtr189.pdf A Tutorial on the Piecewise Regression Approach Applied to Bedload Transport Data, Sandra E. Ryan, Laurie S. Porth
+* @禅系一之花 我喜欢这个指南
+
+http://www.ee.ucla.edu/ee236a/lectures/pwl.pdf UCLA, (2013) Lecture 2 Piecewise-linear optimization
+* 补充了一个UCLA 的偏理论的教程幻灯片
+
+## 统计软件, 都支持这个功能
+
+http://people.ucalgary.ca/~aniknafs/index_files/TR%2094%202011.pdf RapidMiner (这个有免费版,用户挺多)
+
+http://mathematica.stackexchange.com/questions/45745/fitting-piecewise-functions Mathematica
+
+ * http://forums.wolfram.com/student-support/topics/22308 "piecewise linear fit"
+ * "Mathematica Navigator: Mathematics, Statistics and Graphics" page 516
+ * http://dsp.stackexchange.com/questions/1227/fit-piecewise-linear-data
+ * http://coen.boisestate.edu/bknowlton/files/2011/12/Mathematica-Tutorial-Megan-Frary.pdf Mathematica Tutorial
+
+http://mobiusfunction.wordpress.com/2012/06/26/piece-wise-linear-regression-from-two-dimensional-data-multiple-break-points/ matlab
+
+http://stats.stackexchange.com/questions/18468/how-to-do-piecewise-linear-regression-with-multiple-unknown-knots
+matlab
+
+http://www.ats.ucla.edu/stat/sas/faq/nlin_optimal_knots.htm SAS
+
+http://climateecology.wordpress.com/2012/08/19/r-for-ecologists-putting-together-a-piecewise-regression/ R
+* "Piecewise or segmented regression for when your data has two different linear patterns. Again, comments here are good" source: https://twitter.com/statsforbios/status/378163948740026368
+
+https://github.com/scikit-learn/scikit-learn/blob/master/doc/modules/linear_model.rst python
+
+
+## 网友评论
+@视觉动物晴木明川 :分段线性是众多非线性处理方法的本质!//@机器学习那些事儿:你上次说的MLR的分片思想本以为是基于LR-based adaboost 看来要好好学习你的论文了 //@heavenfireray:给个好玩的,我之前演示分段线性的菱形数据,LR-based adaboost的准确率超不过55%(分片线性模型能到99%以上)
+http://weibo.com/1718403260/ADrUnChqt
+
+http://arxiv.org/abs/1401.6413 Online Piecewise Linear Regression via Infinite Depth Context Trees N. Denizcan Vanli, Muhammed O. Sayin, Suleyman S. Kozat
+
+
+## 相关的阅读
+http://www.eccf.ukim.edu.mk/ArticleContents/JCEBI/03%20Miodrag%20Lovric,%20Marina%20Milanovic%20and%20Milan%20Stamenkovic.pdf 时间序列分析
+
+
diff --git a/awesome/query-intent.md b/awesome/query-intent.md
new file mode 100644
index 0000000..611fc5b
--- /dev/null
+++ b/awesome/query-intent.md
@@ -0,0 +1,15 @@
+http://www.cnblogs.com/yangxudong/p/3750358.html Query意图分析:记一次完整的机器学习过程(scikit learn library学习笔记)
+
+http://www.tao-sou.com/740.html 淘宝搜索Query的15个类型(500个query样本)以及与百度谷歌的比较
+
+http://searchnewscentral.com/20110531166/Technical/query-classification-understanding-user-intent.html Query classification; understanding user intent
+
+http://dl.acm.org/citation.cfm?id=1351372 Determining the informational, navigational, and transactional intent of Web queries
+
+http://dl.acm.org/citation.cfm?id=1507510 Survey and evaluation of query intent detection methods
+
+http://www.slideshare.net/daniel.gayo/survey-and-evaluation-of-query-intent-detection-methods
+
+http://www.ijarce.com/downloads/may-2014/IJARCE-13201416.pdf Survey and Analysis for User Intention Refined Internet Image Search
+
+http://gesterling.wordpress.com/2010/03/03/local-queries-vs-local-intent/ Local Queries vs. ‘Local Intent’
diff --git a/awesome/question-answer.md b/awesome/question-answer.md
new file mode 100644
index 0000000..5ea03f7
--- /dev/null
+++ b/awesome/question-answer.md
@@ -0,0 +1,53 @@
+# 问答系统资料整理
+
+
+## 智能个人助理(Intelligent personal assistant)
+* [Amazon Evi](http://www.evi.com/) (launched in 2012) "best selling mobile app that can answer questions about local knowledge"
+** formerly [True Knowledge](http://en.wikipedia.org/wiki/Evi_(software)) (launched in 2007), "a natural answering question answering system", acquired by Amazon in 2012
+* [Google Now](http://www.google.com/landing/now/) (launched in 2012) "an intelligent personal assistant developed by Google"
+* [Apple Siri](https://www.apple.com/ios/siri/) (launched in 2011) "an intelligent personal assistant and knowledge navigator which works as an application for Apple Inc.'s iOS."
+** Siri IOS app (by Siri Inc.) (launched in 2009), founed in 2007, acquired by Apple in 2010
+* [Microsoft Cortana](http://www.windowsphone.com/en-us/how-to/wp8/cortana/meet-cortana) "an intelligent personal assistant on Windows Phone 8.1"
+* [Sumsung S Voice](http://www.samsung.com/global/galaxys3/svoice.html) (launched in 2012) "an intelligent personal assistant and knowledge navigator which is only available as a built-in application for the Samsung Galaxy”
+
+
+* [Jelly](http://en.wikipedia.org/wiki/Jelly_%28app%29) "an app (currently available on iOS and Android) that serves as a Q&A platform, created by a company of the same name led by Biz Stone, one of Twitter's co-founders. " ," it encourages people to use photos to ask questions"
+* [Viv](http://viv.ai/) (launching in 2014) "a global platform that enables developers to plug into and create an intelligent, conversational interface to anything."
+* [出门问问](http://chumenwenwen.com/)
+
+* [Project CALO](http://en.wikipedia.org/wiki/CALO) (2003-2008) funded by the Defense Advanced Research Projects Agency (DARPA) under its Personalized Assistant that Learns (PAL) program
+* [Vlingo](http://en.wikipedia.org/wiki/Vlingo) acquired by Nuance in December 2011
+* [Voice Mate](http://en.wikipedia.org/wiki/Voice_Mate) LG
+
+
+## 智能自动问答系统:
+* [IBM Watson](http://www.ibm.com/smarterplanet/us/en/ibmwatson/) (launched in 2013)
+** [IBM DeepQA (watson)](https://www.research.ibm.com/deepqa/deepqa.shtml) (launched in 2011) "A first stop along the way is the Jeopardy! Challenge..."
+* [Wolfram alpha](http://www.wolframalpha.com/) "which was released on May 15, 2009"
+* [Project Aristo](http://www.allenai.org/TemplateGeneric.aspx?contentId=8) current project at Allen Institute for Artificial Intelligence (AI2)
+** [Porject Halo](http://www.allenai.org/TemplateGeneric.aspx?contentId=9) past project
+
+
+## 聊天机器人(Chatbot)与图灵测试:
+* [小Q(腾讯聊天机器人)](http://qrobot.qq.com/) "QQ机器人是腾讯公司陆续推出的人工智能聊天机器人的总称" (2013)
+* [微软小冰](http://www.msxiaoice.com/v2/DesktopLanding) "微软小冰是领先的跨平台人工智能机器人" (2014)
+* [Eugene Goostman](http://en.wikipedia.org/wiki/Eugene_Goostman) "portrayed as a 13-year-old Ukrainian boy" (2001-)
+* [Cleverbot](http://en.wikipedia.org/wiki/Cleverbot) "a web application that uses an artificial intelligence algorithm to have conversations with humans"
+* [ELIZA](http://en.wikipedia.org/wiki/ELIZA) ELIZA is a computer program and an early example of primitive natural language processing (1976)
+
+## 人工问答系统:
+* ask.com
+* https://answers.yahoo.com/
+* http://answers.com
+** http://wiki.answers.com/
+* stackoverflow
+* reddit
+* quora
+* Formspring qa based social network
+* 知乎
+* 百度知道
+* 百度微问答
+* http://segmentfault.com/
+* 天涯 http://wenda.tianya.cn/
+更多见维基百科 http://en.wikipedia.org/wiki/List_of_question-and-answer_websites
+
diff --git a/awesome/rdb-rdf.md b/awesome/rdb-rdf.md
new file mode 100644
index 0000000..f92d5fb
--- /dev/null
+++ b/awesome/rdb-rdf.md
@@ -0,0 +1,41 @@
+# Relational Databases to RDF (RDB2RDF)
+摘要:[经典收藏]如何将关系数据库数据映射到语义万维网RDF表达方式并支持SPARQL查询语言。
+
+editor(s): [吴伟](https://github.com/wwumit), [好东西传送门](https://github.com/haoawesome)
+
+
+# Overview
+http://www.csee.umbc.edu/courses/graduate/691/spring14/01/notes/20_rdbs/20r2r.pdf Short story - RDB and RDF 1, Tim Finin's class notes - [CMSC 491/691 Special Topics: A Web of Data]( http://www.csee.umbc.edu/courses/graduate/691/spring14/01/)
+
+http://www.slideshare.net/juansequeda/rdb2-rdf-tutorial-iswc2013 Long story - the Relational Databases to RDF (RDB2RDF) Tutorial at the 2013 International Semantic Web Conference (ISWC2013)
+
+http://www.w3.org/2001/sw/wiki/RDB2RDF
+
+
+# W3C Recommendations
+
+http://www.w3.org/TR/r2rml/ R2RDF, W3C Recommendation 2012
+
+http://www.w3.org/TR/rdb-direct-mapping/ Direct Mapping, W3C Recommendation 2012
+
+# Tools
+
+## Academic Research
+
+https://github.com/nkons/r2rml-parser
+
+https://github.com/antidot/db2triples
+
+http://d2rq.org/
+
+http://www.capsenta.com/
+
+http://www.dblab.ntua.gr/~bikakis/SPARQL-RW.html
+
+http://www.dblab.ntua.gr/~bikakis/SPARQL2XQuery.html
+
+## Commerial Tools
+http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VirtR2RML OpenLink Virtuoso
+
+http://docs.oracle.com/database/121/RDFRM/sem_relational_views.htm Oracle database
+
diff --git a/awesome/recurrent-neural-networks.md b/awesome/recurrent-neural-networks.md
new file mode 100644
index 0000000..c963130
--- /dev/null
+++ b/awesome/recurrent-neural-networks.md
@@ -0,0 +1,29 @@
+contributors: @ICT_朱亚东 @维尔茨
+
+card list: http://bigdata.memect.com/?tag=rnn
+
+https://github.com/memect/hao/blob/master/awesome/recurrent-neural-networks.md
+
+## 学习资源
+http://en.wikipedia.org/wiki/Recurrent_neural_network 背景知识
+
+http://minds.jacobs-university.de/sites/default/files/uploads/papers/ESNTutorialRev.pdf ( @ICT_朱亚东 推荐, 短教程) H. Jaeger (2002): Tutorial on training recurrent neural networks, covering BPPT,RTRL, EKF and the "echo state network" approach. GMD Report 159, German National Research Center for Information Technology, 2002 (48 pp.)
+
+http://www.cs.toronto.edu/~graves/preprint.pdf (@维尔茨 认证, 教科书) Supervised Sequence Labelling with Recurrent Neural Networks. Textbook, Studies in Computational Intelligence, Springer, 2012.
+
+http://www.idsia.ch/~juergen/rnn.html (资源列表) over 60 RNN papers by Jürgen Schmidhuber's group at IDSIA
+
+## 专家
+
+http://www.cs.toronto.edu/~graves/ Alex Graves
+
+http://www.idsia.ch/~juergen/ Jürgen Schmidhuber
+
+http://research.microsoft.com/en-us/projects/rnn/ Microsoft RNN group
+
+
+## 相关讨论
+### @维尔茨 RNN label sequence: https://github.com/memect/hao/issues/41
+问: @维尔茨 有木有关于循环神经网络在segmented sequence labeling方面的papers么?我希望用RNN label sequence本身而非sequence members
+
+答: 多伦多大学的 Alex Graves 有专著研究此问题. 基于recurrent neural networks(RNN)研究: @ICT_朱亚东 推荐Herbert Jaeger的短教程(40多页). Jürgen Schmidhuber教授收集了60多相关论文, 微软研究院利用RNN做自然语言处理
diff --git a/awesome/reverse-proxy-load-balancer.md b/awesome/reverse-proxy-load-balancer.md
new file mode 100644
index 0000000..60739ea
--- /dev/null
+++ b/awesome/reverse-proxy-load-balancer.md
@@ -0,0 +1,39 @@
+# 提高网站页面响应速度的解决方案: DNS A-Record, 反向代理及负载均衡
+
+contributors @mahak, BUPTGuo , 情非得已小屋, 新世界_玉兔 , 52cs
+
+discussion: https://github.com/memect/hao/issues/48
+
+keywords:
+ DNS A-Record,
+ 负载均衡(load balancer),
+ 反向映射 (reverse proxy),
+
+
+## 解决方案
+http://webmasters.stackexchange.com/questions/10927/using-multiple-a-records-for-my-domain-do-web-browsers-ever-try-more-than-one 最简单的方案, DNS设置, 在一个域名下设置多个 "A" record, 即一个域名映射多个IP地址, 然后由域名服务器与浏览器共同选择其中的一个IP访问
+
+http://yijiu.blog.51cto.com/433846/1408443 基于Nginx反向代理及负载均衡
+
+http://fournines.wordpress.com/2011/12/02/improving-page-speed-cdn-vs-squid-varnish-nginx/ Improving page speed: CDN vs Squid/Varnish/nginx/mod_proxy
+
+http://en.wikipedia.org/wiki/Reverse_proxy
+
+
+http://en.wikipedia.org/wiki/Load_balancing_%28computing%29#Load_balancer_features
+
+
+## 讨论
+@52cs 一个域名貌似只能绑定一个IP,这么多服务器怎么都可以被域名找到呢?
+
+mahak: 域名服务的A记录可以是多个ip做循环(round roubin),请求到了ip之后,可以是负载均衡设备,具体均衡策略可根据应用调整,比如是否会话保持等。
+
+BUPTGuo:负载均衡? (8月3日 17:17)
+
+好东西传送门:[求助] 欢迎大家到这里去解答 http://t.cn/RPi5Prc 小声说一句:应该是通过load balancer或reverse proxy //@龙星计划: 求科普 (8月3日 17:51)
+
+情非得已小屋:负载均衡+反向映射 (8月3日 19:24)
+
+新世界_玉兔:DNS提供负载均衡 (8月4日 16:05)
+
+
diff --git a/awesome/semanticweb-dl b/awesome/semanticweb-dl
new file mode 100644
index 0000000..675795b
--- /dev/null
+++ b/awesome/semanticweb-dl
@@ -0,0 +1,64 @@
+ 徐涵W3China 2014-11-21 08:00
+《黄智生博士谈语义网与Web 3.0》时隔多年,这篇5年前的访谈至今很大程度上仍然受用。@好东西传送门http://t.cn/RzA6G69
+好东西传送门 转发于2014-11-21 10:10
+在知识图谱已广为人知的今天,回顾这篇访谈很有必要。
+Gary南京 转发于2014-11-22 06:57
+谈语义Web最好不要把OWL和描述逻辑的作用过分夸大,因为本体不等于描述逻辑,语义Web的实现不一定要描述逻辑,描述逻辑很多东西在Web上是无用的
+任远AI 转发于2014-11-22 07:04
+OWL作为一个逻辑上的探索还是非常有价值的,提供了可计算性,完备性,正确性都有保障的情况下的一个表达能力的(近似)上界。
+徐涵W3China 转发于2014-11-22 08:05
+逻辑专家谈描述逻辑!
+昊奋 转发于2014-11-22 08:48
+任何时候都有符合当前潮流需要大力推广的技术,至少在这几年,基于描述逻辑和owl知识表示的任何技术还只能停留在科研范围,不过说不定过了几年又会得到重视,deep semantic或许是一个好的名字,也应该会走从shallow learning到deep learning发展的路。
+Gary南京 转发于2014-11-22 10:22
+OWL和描述逻辑只是众多推理和表示方法中的一种,其实没那么重要,之所以最近几年红火,只是学术界吹捧的,发了很多没什么用的论文,真正实用性是很差的,一旦没有实用性,就会被抛弃,这就是近两年来描述逻辑冷下去的原因,脱离实际的推理是不会有什么影响力的
+昊奋 转发于2014-11-22 10:37
+由漆教授作这样的逻辑推理专家做出如此反思和结论,更值得称赞,同时也比我等不做逻辑的人大谈特谈来得更能让人信服
+Gary南京 转发于2014-11-22 10:48
+呵呵,@昊奋 对推理的理解也是比较深的,我之所以说这些,是因为我不认为我自己的搞描述逻辑的,我不会把自己限制在某个门派,只要是有意思的东西都可以做,其实目前真正有用的还是早期的那些产生式规则、语义网络的东西
+昊奋 转发于2014-11-22 11:05
+回复@Gary南京:这种开放的精神值得赞
+任远AI 转发于2014-11-22 12:04
+赞同不应有门派之间。不过科研成果的实用性还是很难预计的。像语义网络在早期发展的时候也没特别大的影响力,这两年才在知识图谱之类的工业界应用上开始发挥作用。所以以后逻辑方法会有怎么样的前景还很不好说。
+任远AI 转发于2014-11-22 12:09
+如果漆教授可以再详细阐述一下描述逻辑之所以实用性差的问题核心,以及结合实际的推理技术应具备的特征,会是一个很有价值的课题!
+昊奋 转发于2014-11-22 12:37
+这个提议很好,不过挺难回答好,如果说清楚会对业界和学术界影响很大
+Gary南京 转发于2014-11-22 13:21
+这个要全面分析是很难的,我也是在思考当中,不过今年年初在Huddersfield的一个聚集了OWL推理的一些精英的研讨会上,大家对OWL的在大公司中是否有用的讨论中,发现其实很少有公司在用,其实OWL比较有用的也就DL-Lite, EL,就算这两个影响力其实是有限的。我说OWL实用性差就是基于此次讨论做的
+Gary南京 转发于2014-11-22 13:26
+另外,要注意的是,搞逻辑的总觉得自己的东西很有用,其实现在逻辑是基于知识库才有威力的,而真正有多少知识库是描述逻辑可以用的?知识获取的瓶颈突破不了,逻辑只是纸上谈兵而以,这就是KR不如ML和NLP的主要原因,而KR届真正意识到这点的人很少
+任远AI 转发于2014-11-22 16:23
+回复@Gary南京:我个人觉得描述逻辑的研究的出发点是相当有野心的,试图找出各种概念模型的一个可判定的最大“并集”,以此来解决异构知识的整合问题。可是工程和认知上实现并集的代价太大了,目前能做的其实只是各种模型的“交集”,这也是为什么越轻的DL相对越常用的原因。复杂DL只在极特定的领域可用
+Gary南京 转发于2014-11-22 16:46
+回复@任远AI:描述逻辑是否有用这个问题其实不需要去争论,因为肯定是有用的。不过在Web上,知识的表示是多样性的,描述逻辑只是其中一种而以,不需要过分的夸大,这就是我的观点,08年以前就是过分夸大了,照成泡沫,现在也差不多爆掉了
+Gary南京 转发于2014-11-22 16:52
+如果你去看看现在搞描述逻辑的人都在做什么你就会发现,所谓的OWL 2其实没多大影响力,大部分人都在搞DL-Lite, EL, OWL 2 RL,这其实就是对的,很多时候,越是简单的越实用。我其实对OWL 2一直就觉得没多大用,都是搞研究的人在空想的,应用中不一定是这样,只有根植于生活中的东西才有生命力
+任远AI 转发于2014-11-22 16:55
+KR和知识获取本来应该是相互依存的关系。但现在知识获取有瓶颈,KR的人等不下去,于是只能想象出一些情境来做研究。以后Linked Data和WikiData可能会给KR提供一个更扎实的基础。
+Gary南京 转发于2014-11-22 16:59
+表面上看是KR的人等不下去了,其实本质上是做KR的人没有应用驱动的去思考问题,只会去从理论方向去想问题,容易脱离实际,我觉得要真正做好KR,就需要去了解应用,而不是纸上谈兵。现在KR届的人思想太僵化,抱着自己的一某三分地不放,没有创新,最终很多组都会消亡
+任远AI 转发于2014-11-22 17:02
+这点我赞同,其实Ian和Franz早期搞DL的时候还是基于Galen和SNOMED之类的本体的,还是贴近实践的。只是搞逻辑的天生喜欢精巧复杂的东西,喜欢探讨理论上的可能性。这个算是KR领域的一个基因了。。。
+任远AI 转发于2014-11-22 17:15
+我觉得主要是逻辑这个圈子和工程师思维八字不合。像做ML或者NLP的可以说针对某个特定的应用对某个经典的模型进行改进提升了n%的精度。这种文章在KR里面是很难发的,你必须说你这个改进不是ad hoc的,有可推广性,是某种意义上的最优解。这就逼到理论的路子上去了。
+任远AI 转发于2014-11-22 17:29
+回复@Gary南京:哈哈哈深有同感。其实搞理论,搞证明,搞复杂的东西没啥错。为理论而理论,而证明而证明,而复杂而复杂就没必要的。有时候看到很多文章,框架定理一套套,证明了一堆很玄的东西,看得你热血沸腾,最后实质可以用的就那么一丁点。我就不说是谁了[doge][doge][doge]
+昊奋 转发于2014-11-22 17:54
+KR只是解决知识表示和知识模型的问题,但终究还有知识获取等问题。所以要成功,一定是开放,拥抱其他领域,针对具体的问题,踏踏实实的做出一些东西。ML和NLP的深入人心也是靠做出来的
+昊奋 转发于2014-11-22 17:55
+已经很明显地说明是谁了,[嘻嘻]
+昊奋 转发于2014-11-22 18:01
+一般要确定你做的是本体编辑还是ontology population还是ontology learning,对于编辑,可以用protégé或各种基于wiki的本体编辑,如果是population,如NELL等基于本体的学习算法可用,这时是生成实例,如果是最后一种情况,MPI的PATTY等可以参考,这种可以学习新的本体模式
+Gary南京 转发于2014-11-22 18:03
+回复@昊奋:是的,ML和NLP也很多灌水的论文,基本上没多大用,只是因为有应用支撑才红火起来的
+任远AI 转发于2014-11-22 18:14
+手工本体编辑很难规模化,大的本体都是十多年的努力才做成的。也许以后要用自动翻译之类的方法来生成本体
+昊奋 转发于2014-11-22 18:17
+所以在本体编辑的时候需要借助搜索或其他途径来获取现有相关本体并达到复用的目的。
+昊奋 转发于2014-11-22 18:32
+回复@anklebreaker11: 领域本体的构建请先查阅是否有相关的本体或者是否可以从通用的本体或知识库中抽取一个子集来获得。接着,再是类似NELL的方法来进一步扩充实例知识。
+昊奋 转发于2014-11-22 18:48
+回复@anklebreaker11: 医学领域比较复杂,不过你可以先了解一下LODD (linked open drug data) 以及 linked life science中涉及到的如snomed-ct等本体。另外,很多本体是包含中文标签的。当然如果涉及中医,可能需要更多依赖中文的资料,特别是医古文书籍等进行开放式抽取等。
+
+
diff --git a/awesome/sparse-representation-cv.md b/awesome/sparse-representation-cv.md
new file mode 100644
index 0000000..dbc57cb
--- /dev/null
+++ b/awesome/sparse-representation-cv.md
@@ -0,0 +1,15 @@
+http://www.eecs.berkeley.edu/~yang/software/l1benchmark/index.html sparse Optimization
+
+http://perception.csl.illinois.edu/matrix-rank/ Low-Rank Representation
+
+http://www.eecs.berkeley.edu/%7Eyang/courses/ECCV2012/ECCV12-lecture1.pdf Introduction to Sparse Representation and Low-Rank Representation
+
+http://www.eecs.berkeley.edu/%7Eyang/courses/ECCV2012/ECCV12-lecture2.pdf Variations of Sparse Optimization and Their Numerical Implementation
+
+http://www.eecs.berkeley.edu/%7Eyang/courses/ECCV2012/ECCV12-lecture3.pdf Finding and Harnessing Low-Dimensional Structure of High-Dimensional Data
+
+http://www.eecs.berkeley.edu/~yang/ Allen Y. Yang
+
+http://www.columbia.edu/~jw2966/ John Wright
+
+http://yima.csl.illinois.edu/ Yi Ma
diff --git a/awesome/speech-recognition.md b/awesome/speech-recognition.md
new file mode 100644
index 0000000..edbf3bf
--- /dev/null
+++ b/awesome/speech-recognition.md
@@ -0,0 +1,118 @@
+#深度学习在语音识别的研究,以及语音处理常用资源
+
+keywords:
+ speech processing,
+ speech recognition,
+ speaker recognition,
+ deep learning
+
+card lists:
+* http://hao.memect.com/?tag=speechRecognition
+* http://bigdata.memect.com/?tag=speech+deeplearning
+
+https://github.com/memect/hao/blob/master/awesome/speech-recognition.md
+
+## deep learning and speech recognition
+###Microsoft
+
+http://research.microsoft.com/en-us/people/deng/
+Li Deng (IEEE M'89;SM'92;F'04) received the Ph.D. degree from the University of Wisconsin-Madison. He was an assistant professor (1989-1992), tenured associate professor (1992-1996), and tenured Full Professor (1996-1999) at the University of Waterloo, Ontario, Canada. In 1999, he joined Microsoft Research, Redmond, WA, where he is currently Principal Researcher and Research Manager of the Deep Learning Technology Center. Since 2000, he has also been an Affiliate Full Professor and graduate committee member at the University of Washington, Seattle, teaching graduate course of Computer Speech Processing and serving on Ph.D. thesis committees. Prior to joining Microsoft, he also worked or/and taught at Massachusetts Institute of Technology, ATR Interpreting Telecom. Research Lab. (Kyoto, Japan), and HKUST. He has been granted over 60 US or international patents in acoustics/audio, speech/language technology, and machine learning. He received numerous awards/honors bestowed by IEEE, ISCA, ASA, Microsoft, and other organizations.
+
+http://research.microsoft.com/pubs/217165/ICASSP_DeepTextLearning_v07.pdf Deep Learning for Natural Language Processing and Related Applications, Microsoft
+
+http://www.cs.toronto.edu/~ndjaitly/techrep.pdf Application of Pretrained Deep Neural Networks to Large Vocabulary Conversational Speech Recognition (2012) interspeech
+(work at Google)
+
+http://research.microsoft.com/pubs/189008/tasl-deng-2244083-x_2.pdf Li Deng, Xiao Li, Machine Learning Paradigms for Speech Recognition: An Overview
+
+### Google
+
+http://www.cs.toronto.edu/~hinton/
+Geoffrey Everest Hinton FRS (born 6 December 1947) is a British-born computer scientist and psychologist, most noted for his work on artificial neural networks. He is now partly working for Google.[1] He is the co-inventor of the backpropagation and contrastive divergence training algorithms and is an important figure in the deep learning movement.
+
+http://research.google.com/pubs/VincentVanhoucke.html
+Vincent Vanhoucke is a Research Scientist at Google. He is a technical lead and manager in Google's deep learning infrastructure team. Prior to that, he lead the speech recognition quality effort for Google Search by Voice. He holds a Ph.D. in Electrical Engineering from Stanford University and a Diplôme d'Ingénieur from the Ecole Centrale Paris.
+
+http://psych.stanford.edu/~jlm/pdfs/Hinton12IEEE_SignalProcessingMagazine.pdf Deep Neural Networks for Acoustic Modeling in Speech Recognition (2012) IEEE Signal Processing Magazine
+
+http://research.google.com/pubs/SpeechProcessing.html Google Speech processing
+
+### other research groups
+http://mi.eng.cam.ac.uk/Main/Speech/ Cambridge University
+* 回复@黄浩XJU: 谢谢指正,剑桥的工作很全面,目前 http://t.cn/RP8YGTX Phil Woodland 有个中国学生 张超 在做深度学习研究
+
+
+http://www.speech.cs.cmu.edu/ CMU
+
+http://www.speech.sri.com/ SRI
+
+http://www.clsp.jhu.edu/people/ Center for Language and Speech Processing at Johns Hopkins University
+
+
+## speech processing resources
+
+
+
+### tools and open source tools
+http://en.wikipedia.org/wiki/List_of_speech_recognition_software
+* quite some software leverage google speech api to provide online speech to text on mobile devices.
+
+
+http://www.signalprocessingsociety.org/technical-committees/list/sl-tc/spl-nl/2013-05/ALIZE/ ALIZE 3.0 - Open-source platform for speaker recognition
+
+https://github.com/taf2/speech2text
+
+
+http://kaldi.sourceforge.net/about.html Kaldi is a toolkit for speech recognition written in C++ and licensed under the Apache License v2.0. Kaldi is intended for use by speech recognition researchers.
+* @黄浩XJU: 提一下Daniel Povey(http://www.danielpovey.com/) 的Kaldi吧,很好的工具
+
+
+### products
+
+http://www.consumersearch.com/voice-recognition-software/review
+
+http://www.nuance.com/dragon/index.htm
+
+http://en.wikipedia.org/wiki/Windows_Speech_Recognition
+
+http://download.cnet.com/windows/voice-recognition-software/?tag=bc
+
+http://www.labnol.org/internet/dictation-for-google-chrome/24719/
+
+
+### exploration
+http://en.wikipedia.org/wiki/Speech_recognition
+
+http://www.technologyreview.com/news/427793/where-speech-recognition-is-going/ Where Speech Recognition Is Going
+
+http://technav.ieee.org/tag/1597/speaker-recognition 48 resources related to Speaker Recognition
+
+http://www.emory.edu/BUSINESS/speech/SpeechRecCase.pdf nuance white paper, business use cases
+
+
+### conferences
+Popular speech recognition conferences held each year or two include SpeechTEK and SpeechTEK Europe, ICASSP, Interspeech/Eurospeech, and the IEEE ASRU. Conferences in the field of natural language processing, such as ACL, NAACL, EMNLP, and HLT, are beginning to include papers on speech processing. Important journals include the IEEE Transactions on Speech and Audio Processing (now named IEEE Transactions on Audio, Speech and Language Processing), Computer Speech and Language, and Speech Communication.
+
+http://www.interspeech2014.org/public.php?page=tutorial.html tutorial of interspeech 2014
+
+http://www.icassp2014.org/tutorials.html icassp 2014
+
+http://www.speechtek.com/2014/ SpeechTek
+
+http://www.asru2013.org/ ASRU
+
+http://www.iscslp2014.org/public.php?page=keynote.html ISCSLP@INTERSPEECH 2014 - The 9th International Symposium on Chinese Spoken Language Processing
+
+
+## discussion
+ @血色又残阳 问:需要语音处理的资料? 要求
+1、论文最好有配套代码,可以跑;
+2、当前学术界和工业界最新或者主流技术有哪些;
+3、是否有跟深度学习结合的;
+4、最好也有说话人鉴别的相关论文和代码。
+
+https://github.com/memect/hao/issues/50
+
+
+ yongsun :有没有开源或者免费的英文语音识别软件/或项目? 打算翻译一些冰球教学的视频,想结合识别结果来进行听译
+https://github.com/memect/hao/issues/53
diff --git a/awesome/stanford-cs224w.md b/awesome/stanford-cs224w.md
new file mode 100644
index 0000000..0f7d915
--- /dev/null
+++ b/awesome/stanford-cs224w.md
@@ -0,0 +1,41 @@
+http://web.stanford.edu/class/cs224w/
+
+
+#class notes
+http://web.stanford.edu/class/cs224w/slides/01-intro.pdf
+
+http://web.stanford.edu/class/cs224w/slides/02-gnp.pdf
+
+http://web.stanford.edu/class/cs224w/slides/03-smallworld.pdf
+
+http://web.stanford.edu/class/cs224w/slides/04-navigation.pdf
+
+http://web.stanford.edu/class/cs224w/slides/05-evals.pdf
+
+http://web.stanford.edu/class/cs224w/slides/06-signed.pdf
+
+http://web.stanford.edu/class/cs224w/slides/07-cascading.pdf
+
+http://web.stanford.edu/class/cs224w/slides/08-cascades.pdf
+
+http://web.stanford.edu/class/cs224w/slides/09-influence.pdf
+
+http://web.stanford.edu/class/cs224w/slides/10-outbreak.pdf
+
+http://web.stanford.edu/class/cs224w/slides/11-powerlaws.pdf
+
+http://web.stanford.edu/class/cs224w/slides/12-evolution.pdf
+
+http://web.stanford.edu/class/cs224w/slides/13-pagerank.pdf
+
+http://web.stanford.edu/class/cs224w/slides/14-kronecker.pdf
+
+http://web.stanford.edu/class/cs224w/slides/15-weakties.pdf
+
+http://web.stanford.edu/class/cs224w/slides/16-spectral.pdf
+
+http://web.stanford.edu/class/cs224w/slides/17-overlapping.pdf
+
+http://web.stanford.edu/class/cs224w/slides/19-memes.pdf
+
+http://web.stanford.edu/class/cs224w/slides/20-review.pdf
diff --git a/awesome/test-recent.md b/awesome/test-recent.md
new file mode 100644
index 0000000..550126a
--- /dev/null
+++ b/awesome/test-recent.md
@@ -0,0 +1,92 @@
+
+2014-09-26 问:有没有最新的讲述人工智能发展史,现状,展望的资料? 答:人工智能(Artificial Intelligence) 领域综述有一个很好玩的图 "AI Landscape" (2008年AI Magazine附送的海报), 再配上一个AI历史大事件的时间轴demo “ Companion Timeline of Artificial Intelligence History” http://t.cn/RhTXnDF [ [微博](http://www.weibo.com/5220650532/BoJAcrUuy) ]
+
+2014-09-26 不错,这个应该是第二版 @Vamei 2013年的第一版还有些有趣的图片 http://t.cn/zYtMBGK //@西瓜大丸子汤: 推荐给@好东西传送门 //@Vamei:原作者来认领 [ [微博](http://www.weibo.com/5220650532/BoHdz858S) ]
+
+> 2014-09-25 @Linux中国: #Python 语言的发展简史# Python是我喜欢的语言,简洁,优美,容易使用。前两天,我很激昂的向朋友宣传Python的好处。 好吧,我承认Python不错,但它为什么叫Python呢? 呃,似乎是一个电视剧的名字。 那你说的Guido是美国人么? 他从Google换到Dropb…http://t.cn/RhYgiGm [ [微博](http://www.weibo.com/1772191555/BoG25tiMh) ]
+
+2014-09-25 这个scrum guide是个经典,对scrum困惑的同学可以看看。同时推荐好文 "The 2013 Scrum Guide changes" http://t.cn/RhjdQ1W 1. Artefact Transparency strengthened 2. Sprint Planning 3. Definition of Ready 4. Time boxes relaxed for most meetings 5. Daily Scrum purpose clarified [ [微博](http://www.weibo.com/5220650532/BoBCqkL9Z) ]
+
+> 2014-09-25 @朱少民: 当Scrum 的应用爆炸式增长时,形形色色的Scrum变种就出现了,不少公司已经忘记了Scrum 的价值和原则,为此,Scrum Alliance、scrum.org等联合发布了对Scrum的指导文件: http://t.cn/Rhjrrbs [ [微博](http://www.weibo.com/1652927771/BoByZyCjh) ]
+
+2014-09-25 问: 求计算神经科学资料? 答: 1. 资源门户网站(学者,论文,课程一网打尽) "Computational Neuroscience on the Web" http://t.cn/RhjQAgV 2. 暑期学校(2010至2014共5期) http://t.cn/RhjQAgc 3. 还有华盛顿大学公开课 "Computational Neuroscience" 谢 @苏梦Neuro-Gatsby @课程图谱 @要有光LTBL 推荐 [ [微博](http://www.weibo.com/5220650532/BoAQg5kj6) ]
+
+2014-09-25 [计算机视觉数据集不完全汇总] http://t.cn/Rhj0T9K 经典热点数据集: ImageNet,Flickr,MNIST 数据集目录: YACVID(200+),ComputerVisionOnline(100+),CVpapers(100+),CVOnline(100+),UIUC,UCSD,NICTA... 感谢 @丕子 @邹宇华 @李岩ICT人脸识别 @网路冷眼 @王威廉 @金连文 @数据堂 zhubenfulovepoem 推荐 [ [微博](http://www.weibo.com/5220650532/BoAbfmDPA) ]
+
+2014-09-24 搞数据挖掘的同仁怎么看? 气象学专业呢? //@复旦陈硕frank: 转发微博 [ [微博](http://www.weibo.com/5220650532/Bot0Cl2BQ) ]
+
+> 2014-09-24 @中国社会科学院金融评论: Journal of Economic Literature最新一期的文章http://t.cn/RhlbJno 对近年来采用高频面板数据研究天气(相对于以往低频数据刻画的“气候”)经济效应的文献进行了评述。作为这一领域的外行,感觉这篇有趣的综述除了有助于找各种IV之外,在某些具体事实和技巧上也很有启发。 [ [微博](http://www.weibo.com/3205772127/BosQWsyNb) ]
+
+2014-09-24 可以看看教学录像,这个课可为两种目标服务:第一、了解计算生物学中的挑战性问题,寻求更好的计算方法,应用前沿的机器学习方法(很好奇深度学习的应用)第二、理解可以使用计算方法,尤其是现成的机器学习工具,把它们应用到生物学、医学前沿问题中 Bioinformatics, Health informatics //@医学统计 [ [微博](http://www.weibo.com/5220650532/Bosjr9NpC) ]
+
+> 2014-09-24 @好东西传送门: 一张图表解析生物信息学中算法的实际应用(摘自"An Introduction to Bioinformatics Algorithms")同时推荐该书作者Pavel Pevzner (UCSD教授, ACM院士) Coursera公开课Bioinformatics Algorithms (今年10月开课) http://t.cn/RhWs4Cp YouTube教学视频 http://t.cn/RhWs4CO 需要较强的数学及算法基础 [ [微博](http://www.weibo.com/5220650532/BorSV49Fo) ]
+
+2014-09-24 一张图表解析生物信息学中算法的实际应用(摘自"An Introduction to Bioinformatics Algorithms")同时推荐该书作者Pavel Pevzner (UCSD教授, ACM院士) Coursera公开课Bioinformatics Algorithms (今年10月开课) http://t.cn/RhWs4Cp YouTube教学视频 http://t.cn/RhWs4CO 需要较强的数学及算法基础 [ [微博](http://www.weibo.com/5220650532/BorSV49Fo) ]
+
+2014-09-24 推荐 @tornadomeet 整理的 《本人常用资源整理(ing...)》 http://t.cn/zO1YaAE #深度学习#, #机器学习#,#数据挖掘#, #计算机视觉#,优化,数学,Linux,领域牛人,课程 ... ;-) 此人的博客可以归类为 #学霸的学习笔记# [ [微博](http://www.weibo.com/5220650532/BortzCrYs) ]
+
+2014-09-24 回复@尘绳聋-SYSU: 补上 @tornadomeet 原作 “机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)” http://t.cn/zRoZPzP 现在已经写了25个笔记! //@尘绳聋-SYSU:数盟的链接里没有标明原作:@tornadomeet [ [微博](http://www.weibo.com/5220650532/Borpttofb) ]
+
+> 2014-09-24 @陈利人: 好文!常见面试之机器学习算法思想简单梳理 http://t.cn/RhWuNHg [ [微博](http://www.weibo.com/1915548291/Bor6t48ji) ]
+
+2014-09-24 感谢! 附09年MLSS主页 http://t.cn/zl1sHfi 09年MLSS 所有还幻灯片打包下载 51M ZIP http://t.cn/RhWBmXr //@bigiceberg: mark,其中09年UK的mlss最经典。 [ [微博](http://www.weibo.com/5220650532/Borng7Ukv) ]
+
+> 2014-09-24 @好东西传送门: 机器学习暑期学校MLSS全集(2002-): MLSS汇集了机器学习界名师,提供基础教程,展示领域进展, 免费讲义下载 -- 是了解领域前沿的好去处。全集罗列了过去的26次课和未来的8次课, 基本上欧洲,美国,澳洲,亚洲各自一摊。原始链接 www.mlss.cc 我们做了个github版补全了缺失链接 http://t.cn/RhWRlBo [ [微博](http://www.weibo.com/5220650532/BoqHnj2qe) ]
+
+2014-09-24 //@AixinSG: 我们做过hashtag扩散的研究 http://t.cn/RhWmsw8 Google Scholar上也有了一些相关的引用文章 http://t.cn/RhWmswE 相对来说扩散要比溯源容易做,溯源很不容易验证 [ [微博](http://www.weibo.com/5220650532/Bor4eu5sU) ]
+
+> 2014-09-24 @好东西传送门: 问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文 http://t.cn/RhW6Suk 特别推荐Guille等"在线社交网络中信息扩散综述"(SIGMOD Record 2013)脑图, 讲了三个挑战及相关解法: 发现有趣话题,扩散过程建模, 识别高影响力节点。此外还有几篇溯源算法研究及一篇Science相关好文 [ [微博](http://www.weibo.com/5220650532/BoqRO7Mzg) ]
+
+2014-09-24 问: 做基于话题的社交网络中的溯源,寻找源头用户, 求文章? 答: 找到5篇论文 http://t.cn/RhW6Suk 特别推荐Guille等"在线社交网络中信息扩散综述"(SIGMOD Record 2013)脑图, 讲了三个挑战及相关解法: 发现有趣话题,扩散过程建模, 识别高影响力节点。此外还有几篇溯源算法研究及一篇Science相关好文 [ [微博](http://www.weibo.com/5220650532/BoqRO7Mzg) ]
+
+2014-09-24 机器学习暑期学校MLSS全集(2002-): MLSS汇集了机器学习界名师,提供基础教程,展示领域进展, 免费讲义下载 -- 是了解领域前沿的好去处。全集罗列了过去的26次课和未来的8次课, 基本上欧洲,美国,澳洲,亚洲各自一摊。原始链接 www.mlss.cc 我们做了个github版补全了缺失链接 http://t.cn/RhWRlBo [ [微博](http://www.weibo.com/5220650532/BoqHnj2qe) ]
+
+2014-09-23 [资料合集] http://t.cn/RhOz6bQ 情感分析(sentiment analysis) 两本经典综述PDF下载: A Survey of Opinion Mining and Sentiment Analysis (2012) by Bing Liu; Opinion mining and sentiment analysis (2008) by Bo Pang, Lillian Lee, 另附Richard Socher等深度学习用于情感分析的论文 欢迎补充 [ [微博](http://www.weibo.com/5220650532/Bohx6Ahic) ]
+
+2014-09-23 回复@禅系一之花: 谢谢提示。《傅立叶变换的简易指南》 http://t.cn/8srbg2x 译者:Taurelasse //@禅系一之花:译言上有翻译版 //@好东西传送门:感谢右边传送 An Interactive Guide To The Fourier Transform //@赶路人林文: http://t.cn/zjN3lQ6 这个傅里叶转换的文章是我看到 [ [微博](http://www.weibo.com/5220650532/Boh4Y1Doi) ]
+
+> 2014-09-19 @好东西传送门: 问: @ShawnLeesr 给找一些好到逆天的 1.信号处理 2 傅里叶变换 3.小波变换的入门资料吧 答: 资料整理 http://t.cn/RhKNdKs 推 @Heinrich_DMU 傅里叶分析之掐死教程。进阶有Stanford傅立叶变换课(Brad Osgood) http://t.cn/RhKNdKF , MIT小波分析课(Gilbert Strang) http://t.cn/RhKNd9v 请指正补充 [ [微博](http://www.weibo.com/5220650532/BnHcFiekf) ]
+
+2014-09-23 //@AllAboutStorage: Freebase小介绍(目标结构化internet)。母公司2010年被Google收购,其技术应该被用到了Google Knowledge Graph这个项目中。感兴趣的同学还可以看一看Google的图数据库Cayley http://t.cn/RvHuYpL 。其介绍就清楚写明:Cayley是受Google知识图谱以及Freebase背后的图数据库启发。 [ [微博](http://www.weibo.com/5220650532/Boh3LyNLP) ]
+
+> 2014-09-23 @好东西传送门: @low_accepted 问:求Freebase Wikipedia Extraction (WEX)的数据集(66GB大小,tsv格式) 答:AWS上有66GB版本的ESB snap-1781757e,挂靠在EC2上免下载。刚才实验了可用。WEX把维基百科英文版的模板、信息框、目录等转化为XML格式 http://t.cn/Rh0kIXp 更多Freebase资源 http://t.cn/Rh0kIX0 [ [微博](http://www.weibo.com/5220650532/Bogtpf4Jr) ]
+
+2014-09-23 问: @神经明亮的人 求perl教程呀? 答: 资料合集 http://t.cn/RhOvrpN Randal Schwartz 的learning Perl(小骆驼)是公认的入门教程, 浅显短小, 建议看英文版。更短有Learn Perl in about 2 hours 30 minutes. 更多看perlmonks.org和perl-tutorial.org的教程合集. 进阶看大骆驼Programming Perl 欢迎补充 [ [微博](http://www.weibo.com/5220650532/Boh22i7QV) ]
+
+2014-09-23 @low_accepted 问:求Freebase Wikipedia Extraction (WEX)的数据集(66GB大小,tsv格式) 答:AWS上有66GB版本的ESB snap-1781757e,挂靠在EC2上免下载。刚才实验了可用。WEX把维基百科英文版的模板、信息框、目录等转化为XML格式 http://t.cn/Rh0kIXp 更多Freebase资源 http://t.cn/Rh0kIX0 [ [微博](http://www.weibo.com/5220650532/Bogtpf4Jr) ]
+
+2014-09-23 感谢右边传送 An Interactive Guide To The Fourier Transform //@赶路人林文: http://t.cn/zjN3lQ6 这个傅里叶转换的文章是我看到的最棒的,无比生动。特别适合文科生,八年没碰过物理,五年没碰过数学的我都看懂了。有时间一定把这个翻译成中文。 [ [微博](http://www.weibo.com/5220650532/BofcOk20k) ]
+
+> 2014-09-19 @好东西传送门: 问: @ShawnLeesr 给找一些好到逆天的 1.信号处理 2 傅里叶变换 3.小波变换的入门资料吧 答: 资料整理 http://t.cn/RhKNdKs 推 @Heinrich_DMU 傅里叶分析之掐死教程。进阶有Stanford傅立叶变换课(Brad Osgood) http://t.cn/RhKNdKF , MIT小波分析课(Gilbert Strang) http://t.cn/RhKNd9v 请指正补充 [ [微博](http://www.weibo.com/5220650532/BnHcFiekf) ]
+
+2014-09-22 Yar, Yac, Yaf 都是 @Laruence 直接在GITHUB上开源的 http://t.cn/zWiKwkj , Zend Optimizer 也有他 http://t.cn/Rh0h8RZ [ [微博](http://www.weibo.com/5220650532/BoaTCoZbG) ]
+
+> 2014-09-22 @Laruence: 又要写总结报告了, 这是目前微博俩年来达成的LNMP的技术结构图..... 也就这么些东西, 大部分都是开源的, 欢迎借鉴. [ [微博](http://www.weibo.com/1170999921/BoaKMhnJp) ]
+
+2014-09-22 问: 增强现实近几年的文章或者相关资料特别是关于PTAM的资料? 答: 资料汇总 http://t.cn/Rh0v03Y PTAM是"即时定位与地图构建" (Simultaneous localization and mapping, SLAM, 机器人视觉的研究方向)的重要进展, 概念于2007年ISMAR最佳论文中提出。2014 CVPR 有一组段教程涉及相关研究 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BoaJeg31R) ]
+
+2014-09-22 传送好东西 #自然语言处理# 论文“Distributed Representations of Sentences and Documents ” Quoc V. Le, Tomas Mikolov, ICML 2014 链接 http://t.cn/RhpdQqv PV = Paragraph Vector [ [微博](http://www.weibo.com/5220650532/BoabnoAha) ]
+
+> 2014-09-22 @ustczen: “Distributed Representations of Sentences and Documents ”中提到的句子向量化算法PV-DM在github上已经有了基于gensim的python实现:http://t.cn/RPDxH82,word2vec论坛有人用它在IMDB数据集上尝试做情感分类,效果没有论文声称的那么牛,但可以参考下实现。@好东西传送门 [ [微博](http://www.weibo.com/2872565912/Bo9xyfdib) ]
+
+2014-09-22 感谢@hnlyjzh 搬运! Large Scale Visual Recognition Challenge视频免梯子下载 [ [微博](http://www.weibo.com/5220650532/Bo6SLASYp) ]
+
+> 2014-09-21 @hnlyjzh: ILSVRC2014的视频在这里http://t.cn/RhNBfX6 @好东西传送门 [ [微博](http://www.weibo.com/1244843177/Bo3i6cufT) ]
+
+2014-09-21 继续传送 //@ICT秦磊: 转了GoogLeNet,放在优酷上。 http://t.cn/RhN58TY 好东西传送门: 帮转,在YouTube上的,看看有没有大神帮忙传送回国 [ [微博](http://www.weibo.com/5220650532/Bo0laE8yh) ]
+
+> 2014-09-20 @贾旭kul_visics: @好东西传送门 ILSVRC2014 videos http://t.cn/RhCTDKX [ [微博](http://www.weibo.com/3195545915/BnUjy7FgT) ]
+
+2014-09-21 转发理论:一张图简明扼要总结了各种概率分布的关系,对机器学习和统计都极具参考价值。另补充维基百科上无版权的图 http://t.cn/zjyvP9q 并有对各种分布的详细解释 [ [微博](http://www.weibo.com/5220650532/BnYMPiRcz) ]
+
+> 2014-09-21 @_散沙_民工智能_: 基础中的基础,各路大数据科学家首先忽略的东西。晚安 http://t.cn/z8AJfHW [ [微博](http://www.weibo.com/1438548745/BnWtujF4q) ]
+
+2014-09-20 帮转,在YouTube上的,看看有没有大神帮忙传送回国 [ [微博](http://www.weibo.com/5220650532/BnVt2ffR0) ]
+
+> 2014-09-20 @贾旭kul_visics: @好东西传送门 ILSVRC2014 videos http://t.cn/RhCTDKX [ [微博](http://www.weibo.com/3195545915/BnUjy7FgT) ]
+
+2014-09-20 问: @情非得已小屋 推荐点关于推荐系统的综述么? 答: 问答207 http://t.cn/RhCt7lc 强推KDD2014讲义 "the recommender problem revisited": 第一部分Xavier Amatriain的综述(135页, 2014机器学习夏季学校版有248页), 第二部分"Context Aware Recommendation" (64页) 谢 @小飞鱼_露 @明风Andy 推荐 [ [微博](http://www.weibo.com/5220650532/BnRHSq1xl) ]
+
+2014-09-20 问: @水月小和尚 求隐私保护的资料 答: http://t.cn/Rh9egwV 隐私保护是大数据时代的重要问题。先推荐一篇2010年综述privacy-preserving data publishing 讲数据发布中的攻击模型, 隐私模型和匿名算法(看附图) 1.3节还列了一些综述, 讲"数据挖掘、数据查询、统计数据发布"中实现隐私保护 欢迎补充指正 [ [微博](http://www.weibo.com/5220650532/BnPOcry6i) ]
+
+2014-09-20 过去一周新增的问答和推荐资源都整理到Github上了http://t.cn/Rh9NSVm 到目前为止有360条主题。要找以前推荐过的资源直接可以在页面上Ctrl+F搜索。BTW,如果你想订阅每周更新,发邮箱给我的私信吧 [ [微博](http://www.weibo.com/5220650532/BnMt3bdgh) ]