
初級版 搜集數據
注冊大量賬號來抽獎
2011年,李德還在學校讀書,微博抽獎活動多如牛毛。于是他寫了個軟件注冊了幾十萬個新浪微博賬號。(那時候還不要求實名制)。
然后他寫了幾個爬蟲軟件從搜狐微博上爬昵稱用來更新新浪微博上的昵稱,從大V的粉絲中爬他們的頭像用來更新自己的微博頭像,從笑話微博中爬微博內容來發到自己微博中。
然后用這幾十萬個微博賬號去參與抽獎,一年獲利了七萬多元。讀書那幾年他承包了他們宿舍所有的水電費和他們班男生宵夜費用。
自己寫程序招聘
創業公司對于招聘總是很頭疼的。技術牛人熊節另辟蹊徑。
他在為ThoughtWorks組建成都分公司團隊的時候,發愁正統招聘方法太慢了。熊節覺得一個好的程序員應該讀過那20本好書
——《重構》《精益創業》《敏捷軟件開發》《測試驅動開發》等等。
于是,他花了幾個晚上用自己高中自學的水貨代碼水平寫了一個程序,去抓取豆瓣上讀過這些技術書籍的人。然后不斷遞歸,再抓到這些人都讀過其它什么書,再繼續抓讀過那些書的人。
抓了幾萬人之后,他再用Hadoop來分析,篩選出了幾十個技術大牛。把這些大牛的豆瓣賬號扔給了公司女HR,讓HR去一個個發豆郵勾搭。
進階版 計算分析
用大數據技術找到愛情
美國波士頓數學家克里斯·麥金利注冊一個婚戀網站后,認為他們的配對模式不合適,于是他自己寫程序,只花了不到90天時間就在茫茫人海中找到了心儀的對象。
這位數學家開設了12個賬戶,利用計算機程序隨意作答網站的配對問卷,從2萬名用戶中收集到600萬條問題的答案,然后利用演算程序篩選出5000名住在美國的活躍用戶,從中按性格分類又選出最符合擇偶條件的兩組女子。
用數據分析的方法教你如何獲得一份美好的愛情
數據化愛情:男生追女生的超強數學建模分析
通過“大數據”科學的辦法來墜入愛情吧
之后麥克金雷又創建了兩個賬號,誠實地回答這兩類姑娘們最關注的500個問題。回答完問題后,他發現和自己匹配度在90%以上的超過10000人,最高匹配度達到了99%。
為了獲得這些姑娘們的關注。麥克金雷編了一個新程序,自動訪問與他匹配度高的對象,對方回訪他的頁面時,就會給他留言。然后再約出來見面,他最終成功在這些人中找到了另一半,這個姑娘和他的匹配度是91%。
高級版 改變社會
找到紐約最差的停車位
在紐約,停車難眾所周知,而且紐約違章停車罰款很嚴格,紐約市的金融部門每年從罰單中收款約為6億美元。
為了發現為什么有這么多的罰款,美國數據分析師本?威零頓利用紐約市消防籠頭的地圖和政府公開的停車違規的罰單信息找出了紐約最容易吃到違章停車罰單的停車位。
他做出了一張前250個遲到最多違章停車罰單的消防栓位置圖。
得出的結論是1、別在上東區停車,千萬別停,因為不論在哪兒都會吃罰單。2、他找出了全紐約市最容易遲到違章停車罰單的兩個消防栓的位置。都在上東區,每年能在罰單上創收5萬5千多美金!
他認為這是很奇怪的一件事,5萬5千多美金!為什么別人都會在那里犯錯!所以他深入挖掘了一下原因,因為每一個消防栓有一個叫做擴展區域的地方可以用來走路,然后是一個停車位。所以司機開到這里來的時候認為“還有一段距離,這里沒問題”,何況地上還有一個停車位。但紐約警察局不認可這個停車位,還是會給他們罰單。
他把這個情況反饋到自己的博客上,收到了交通部門很官方的回復,但是幾周后,他發現這個停車位真的被重新畫了。因為這個發現,將為很多市民們省下罰金。

