數學之美1    

數學之美

   話說找正義之心前看了一下豆瓣的評價,發現有個人對它的評語低,研究了一下這個人所有看過書的評語,發現也許他是個對科普書有眼光卻未必能鎖住社科類書籍的人,於是在他已讀科普書中挑了幾本,這本就這麼反向找來的.

   也許是沒有先預設是怎樣的內容,開始讀後就覺得這書難得.套個作者吳軍比擬的一個故事,當他想了解什麼人工神經網路時,找不到一個善於表述且願意花2個小時告訴他什麼是人工神經網路的好心人,不是碰到一個愛炫耀告訴他正在用人工神經網路做研究,然後就沒有下文的人,要不就是碰到一個好心卻不擅表述的人講了一個小時,用了許多名詞,但他仍聽得雲山霧罩,完全不知道在說什麼,最後只好放棄,自我安慰反正以後也用不到人工神經網路.這本數學之美談的雖是數學,其實不算單純的數學,作者不是以數學的類別來角度切入教人們數學,而是從他自己的工作經驗與研究結果,從使用的功能目的反向來說明達到這樣的結果所需的數學方式,與這些方式原來的使用目標,吳軍任職Google,研究主以語音識別,搜尋引擎,從網路與通訊的產品研究運用中,來談所涉及的數學,因為這些內容都是先登在作者的部落上,這種訴求一般人的文章自然必須用讓大眾較容易理解的方式來寫作,從這個面向看,它不太會是枯燥的內容,但是,畢竟還是涉及數學,不懂那些的應該也看不太懂.

     必須承認這本書中使用的數學方法大部分可能都學過,從商管系所碰到的作業研究或數量方法中的動態規劃,馬可夫鏈,博奕論,到機率,甚至到書末講搜索廣告與邏輯迴歸,用邏輯迴歸來計算入口網站首頁廣告的訂價,邏輯回歸?一時想不起來,但看到後面附的原文logistic regression,驚的一聲x,老朋友了,架上還有很多年前用過的一本原文書General Linear Model,也有少部分是多變分析中的Cluster,Priciple Component Analysis的概念,但即使如此,除了兩岸數學中文名詞略有不同會有些影響外,仍有部分章節附錄的數學模型還是理解上的障礙,但所幸這些就是作者特定劃歸出來作為主題的延伸,看不懂也不妨害閱讀,而這本書對個人最大的感想是,以上的這些學過的方式原來可以被這樣使用,可以用來做語音辨識,最少中文輸入鍵數計算來決定輸入法,文句分析,網頁類別規劃,網路新聞的歸類,搜尋引擎查詢最有效資料網頁排序,這些東西可能只是靠著一個三角函數Cos θ,甚至看完前七章關於語言統計模型後,一個自然而然的想法,這應該能夠拿去做金融投機用,把那些文字輸入變數改成經濟數據,財務數據,甚至是K線的型態,就能產生出一個類似於機器翻譯或語音辨識的功能來產生投資標的,用的是最大熵模型,而後頭在介紹語言統計學的專家Della Pietra兄弟在1988年離開學校後加入James Simon的文藝復興公司,眾所周知他們的避險基金從1988年到2008年的年均報酬約34%,而同期的Buffet約20%,事實上James Simon也是個出眾的數學家.也就是說學沒學過是一回事,知道能以甚麼方式在大家想不到的地方來使用,才是這些數學結果所呈現的美感,否則單憑那些算式,不頭大也不想翻書的人佔了多數吧

   吳軍在內文中談過數學的術與道,他這本書主要在談道,而只講一些粗淺讓人能理解道的術,道就是用這些數學方式運算究竟是要達到什麼目的,如果不清楚這些,光學會設定那些公式,算式與計算是沒有太多意義的,畢竟大多數人都不識純數學家,人們使用這些算法的目的就是希望能改善實體生活的美感,從他在任職過的騰訊,Google所做的工作內容,就能顯出這些方式的效用.一個複雜的語言識別過程,用統計語言模型竟然用簡單的就解決了,這書開篇對個人的沖擊很大,另一個就是余弦定理和新聞的分類,看到作者以三角函數,向量,矩陣來拆解這些複雜的變數資料,然後得出一個分類的方式,不禁覺得也太有趣了,以前以為那些路徑圖,動態規劃的最短路徑不過是小工具,頂多寫學術文章有用,沒想到告種方式都有它的實際出路,實際的用途,各種空間圖形前以為就只能用於畫設計等基礎學科的應用上,哪成想到改變一下思路,改變一下方法,就簡單的把那麽複雜的問題給簡化了,而這正是作者的目標,簡化問題,自己就想一個已經幾乎沒人在用的野路子技術分析開盤八法,也許就另有出路也不一定,把統計語言學的觀點或是人工神經網路的想法概念拿來轉換一下,若把一根k當作輸入的文字看,是不是可能也有預測的功能或是配合大數據的運用能夠找一條機率配置的路,那麼也許有什麼未知的結果出現也不一定.

  數學範圍廣泛,即使是專業研究者也只能選擇幾個主題專攻,恐怕難有人能面面俱精,一本高質量的書籍必然需要一個要描述的主題,這本是以吳軍的專長出發,並不是一本廣泛的數學論述,但就是因為這樣,顯然比那些太過專業的數學書更符合科普的需要,本書所講的哪些數學原理包括自然語言處理,馬科夫模型,最大熵模型,SVD,貝葉斯,邏輯回歸,條件場等都是在機器學習領域發揮功用,這本書的特點之一就是圍繞著語音或網路應用場景講數學原理,事實上與想像的剛好不同,並沒有出現真的難以理解的艱深高等數學模型,反而連我這個管理學院背景的人都學過其中的多數,實在令人意外,雖然這裡面確實有些東西以前也想過能否用來作為交易系統建立的方式,但現實是考慮到時間成本與效益,可能還不如用先採用市面已存在的東西,加上也不可能在本地恰好碰到一些跟自己有相同想法且能戮力合作之人,自然不容易如作者一般在一個菁英團體中產生這些數據產品,而這涉及的正是產業創新發展,教育深化,與社會文化上的不同與三者的連結,也是本地當前經濟問題的濫觴.

   以前或許不全然了解數學的運用能夠深入到生活中的何種程度,書裡面舉出Youtube如何採用數學運算去找出那些未授權的影片,而不是用人工的方式去一個個查找,然後將那些未授權的影片上插播的廣告收入全部轉移給真正有版權的人,侵權的人一毛也拿不到,或是像現在採取用版權頁覆蓋全侵權影片的方式,就頗令人震驚.不要以為機器人自動化的出現只是取代那些工廠,或作業線上的人而已,只會在那些燜熱危險的工廠出現,事實上透過數學與大數據很可能會有對另一類工作型態產生威脅,那威脅鎖住的正是那些坐在冷氣辦公大樓中的人,而我們還不自知危機的可能到來,以上,

arrow
arrow
    全站熱搜

    speculatortw 發表在 痞客邦 留言(0) 人氣()