當(dāng)計(jì)算機(jī)讀懂了你的情緒,世界會(huì)變得更好嗎?

撰文 | Dana Mackenzie
翻譯 | 嚴(yán)如風(fēng)
責(zé)編 | 嶺 桐
一些企業(yè)和研究人員正在試圖用計(jì)算機(jī)來(lái)讀懂文字背后的情感:雖然情感分析產(chǎn)品還遠(yuǎn)非完美,但已經(jīng)能夠從大數(shù)據(jù)中提煉出一些東西,甚至在未來(lái)的某一天可以監(jiān)控人類的心理健康。
很多人認(rèn)為2020年是有史以來(lái)最糟糕的一年,雖然這樣的描述可能過(guò)于主觀,但有一份數(shù)據(jù)可以支持這個(gè)結(jié)論。
Hedonometer(譯者注:Hedono是一個(gè)詞根,意為愉悅)是一種計(jì)算機(jī)化的評(píng)估方法,檢測(cè)我們的幸福與失落。它在佛蒙特大學(xué)的電腦上日復(fù)一日地運(yùn)行,每天從推特上收集約5000萬(wàn)條推文,然后對(duì)公眾的情感進(jìn)行快速、粗略的解讀。根據(jù)Hedonometer的數(shù)據(jù),2020年是它自2008年開始記錄以來(lái)最糟糕的一年。

情感分析已經(jīng)有了多種使用場(chǎng)景。圖片來(lái)源:pexels
50多年來(lái),計(jì)算機(jī)科學(xué)家一直在研究如何使用計(jì)算機(jī)來(lái)評(píng)估單詞的情感基調(diào),Hedonometer是他們?nèi)〉玫谋容^新的進(jìn)展。為了建立Hedonometer,佛蒙特大學(xué)的計(jì)算機(jī)科學(xué)家克里斯-丹佛斯需要教機(jī)器去理解這些推文背后的情感,畢竟人類不可能一一解讀所有推文。這一過(guò)程被稱為情感分析,已經(jīng)在近年來(lái)取得了重大進(jìn)展,并有了多種使用場(chǎng)景。
除了用來(lái)感知Twitter用戶的情緒狀況外,研究人員還利用情感分析來(lái)研究人們對(duì)氣候變化的看法以及驗(yàn)證一般常識(shí),比如在音樂(lè)中小和弦是否比大和弦更悲傷(以及悲傷的程度)等等。而一些覬覦客戶情感信息的企業(yè)正在利用情感分析來(lái)評(píng)估Yelp(美國(guó)最大點(diǎn)評(píng)網(wǎng)站)等平臺(tái)上的評(píng)論,也有一些企業(yè)正在利用它來(lái)感知工作中員工在內(nèi)部社交網(wǎng)絡(luò)上的情緒。這種技術(shù)也可能在醫(yī)學(xué)上得到應(yīng)用,例如識(shí)別需要幫助的抑郁癥患者。
丹佛斯表示,情緒分析可以幫助研究人員分析大量的數(shù)據(jù),而這些數(shù)據(jù)在以前很難被收集,過(guò)程也很費(fèi)時(shí):“在社會(huì)科學(xué)中,我們傾向于測(cè)量那些容易的東西,如國(guó)內(nèi)生產(chǎn)總值,而幸福本身是一個(gè)很重要但很難衡量的東西”。
01
如何讀懂你的詞
你可能認(rèn)為情感分析的第一步是教計(jì)算機(jī)理解人類在說(shuō)什么,但這是計(jì)算機(jī)科學(xué)家無(wú)法做到的,理解語(yǔ)言是人工智能中最臭名昭著的難題之一。其實(shí)書面文字背后有大量的情感線索,即使不理解文字的含義,計(jì)算機(jī)也能識(shí)別情感。
最早的情感分析方法是單詞計(jì)數(shù),這個(gè)想法很簡(jiǎn)單,就是計(jì)算正面詞的數(shù)量和負(fù)面詞的數(shù)量。更好的辦法是根據(jù)單詞的含義進(jìn)行加權(quán),例如“優(yōu)秀(Excellent)”比“良好(Good)”表達(dá)了更強(qiáng)烈的情感,這些權(quán)重通常是由專家配置的:將一部分情感分析中經(jīng)常使用的詞對(duì)應(yīng)到情感的字典中,這一方法被稱為詞庫(kù)法(lexicons)。

最簡(jiǎn)單的情感分析辦法是詞庫(kù)法。圖片來(lái)源:pixabay
但僅僅計(jì)算字?jǐn)?shù)有其固有的問(wèn)題,其一是忽略了語(yǔ)序,只是把句子當(dāng)成了詞的集合。此外計(jì)詞法可能會(huì)遺漏一些來(lái)自特定語(yǔ)境的線索,比如這個(gè)產(chǎn)品評(píng)論:“I’m so happy that my iPhone is nothing like my old ugly Droid. (我很高興,我的iPhone和我老舊丑陋的Android手機(jī)完全不一樣。)”這句話有三個(gè)負(fù)面的詞(“完全不一樣”、“老”、“丑”),只有一個(gè)正面的詞(“高興”);雖然人類能立即意識(shí)到“老舊”和“丑”指的是不同的手機(jī),但對(duì)計(jì)算機(jī)來(lái)說(shuō),這都是負(fù)面的。同時(shí),比較的語(yǔ)境會(huì)帶來(lái)更多的困難?!巴耆灰粯印笔鞘裁匆馑??說(shuō)話者到底想不想把兩者做對(duì)比?語(yǔ)言在有些時(shí)候是令人困惑的。
為了解決這些問(wèn)題,計(jì)算機(jī)科學(xué)家已經(jīng)越來(lái)越多地轉(zhuǎn)向更加復(fù)雜的方法,將人類勞動(dòng)完全排除在這個(gè)過(guò)程之外。他們正在使用機(jī)器學(xué)習(xí)教應(yīng)用程序來(lái)識(shí)別一些范例,比如單詞之間的意義關(guān)系。例如計(jì)算機(jī)可以學(xué)習(xí)當(dāng)“bank”和 “river”這兩個(gè)詞經(jīng)常出現(xiàn)在一起時(shí),“bank”會(huì)代表“河流”的意思,而當(dāng) “bank”和“money”出現(xiàn)在同一個(gè)句子中,那么它的意思可能就會(huì)是“銀行”。
2013年機(jī)器學(xué)習(xí)在這方面取得了重要的進(jìn)展,Google Brain的研究員托馬斯-米科羅夫構(gòu)建了一個(gè)叫做單詞嵌入(word embeddings)的工具,這個(gè)工具將每個(gè)詞映射到50到300個(gè)數(shù)字的列表,稱為一個(gè)向量。這些數(shù)字就像描述一個(gè)詞的指紋,可以描述它和其他詞語(yǔ)出現(xiàn)在一起時(shí)的特征。
為了獲得這些描述符,米克羅夫的程序整理了報(bào)紙文章中的數(shù)百萬(wàn)個(gè)詞,并試圖在給定前面一個(gè)詞的情況下預(yù)測(cè)下一個(gè)詞。米克羅夫的嵌入法可以識(shí)別同義詞:像“錢”和“現(xiàn)金”這樣的詞有非常相似的映射。更巧妙的是,盡管這個(gè)工具實(shí)際上無(wú)法認(rèn)清這些單詞的含義,但它可以捕捉到一些基本的類推:例如國(guó)王之于女王就像男孩之于女孩一樣。鑒于這種類推是美國(guó)高考(SAT)的考察范圍,能夠做到這樣已經(jīng)是一個(gè)了不起的成就了。

神經(jīng)網(wǎng)絡(luò)使得機(jī)器學(xué)習(xí)取得了驚人的進(jìn)展。圖片來(lái)源:pixabay
米克羅夫的單詞嵌入是由一個(gè)具有隱藏層(譯者注:將輸入數(shù)據(jù)的特征通過(guò)一定的神經(jīng)元結(jié)構(gòu)轉(zhuǎn)換至另一個(gè)維度空間,使之可以被合理分類。)的神經(jīng)網(wǎng)絡(luò)生成的。近年來(lái),以人腦為松散模型的神經(jīng)網(wǎng)絡(luò)使機(jī)器學(xué)習(xí)取得了驚人的進(jìn)展,其杰出代表就是AlphaGo。米克羅夫的網(wǎng)絡(luò)是一個(gè)專門設(shè)計(jì)的淺層網(wǎng)絡(luò),可以用于翻譯和話題分析等多種場(chǎng)景。
更深層的神經(jīng)網(wǎng)絡(luò),有更多的“皮層”,可以在一個(gè)特定的句子或文件的背景下提取個(gè)別詞語(yǔ)的情感信息。一個(gè)常見的參考任務(wù)是讓計(jì)算機(jī)閱讀互聯(lián)網(wǎng)電影數(shù)據(jù)庫(kù)(IMDb)上的影評(píng),并預(yù)測(cè)評(píng)論者是給的好評(píng)還是差評(píng)。詞庫(kù)法最早達(dá)到了大約74%的準(zhǔn)確率,往后更復(fù)雜的也只達(dá)到了87%的準(zhǔn)確率;而最早的神經(jīng)網(wǎng)絡(luò)方法在2011年就取得了89%的得分,如今它們的準(zhǔn)確率高達(dá)94%以上,這已經(jīng)接近于人類的水平。然而幽默和諷刺仍然是很大的絆腳石,此時(shí)語(yǔ)言表達(dá)可能會(huì)與預(yù)期情緒相反。
盡管神經(jīng)網(wǎng)絡(luò)有諸多好處,但基于詞庫(kù)的方法仍然很受歡迎,丹佛斯也無(wú)意改變他的Hedonometer詞庫(kù)。神經(jīng)網(wǎng)絡(luò)在一些問(wèn)題的結(jié)果上可能更準(zhǔn)確,但它們也是有代價(jià)的,單單是機(jī)器學(xué)習(xí)的訓(xùn)練期就已經(jīng)是電腦能運(yùn)行最復(fù)雜的任務(wù)之一了。
“基本上,受限于你有多少電,”沃頓商學(xué)院的羅伯特·斯蒂恩說(shuō),他在《2019年度統(tǒng)計(jì)及其應(yīng)用年度回顧》中介紹了情感分析的演變。“谷歌用了多少電來(lái)訓(xùn)練AlphaGo?我聽到的笑話是,這些電足以煮沸海洋。”
除了電力需求外,神經(jīng)網(wǎng)絡(luò)還需要昂貴的硬件和一定的專業(yè)技術(shù),而且機(jī)器學(xué)習(xí)的過(guò)程缺乏透明度,計(jì)算機(jī)是在自己摸索如何處理任務(wù),而不是按部就班遵循程序員的指示。作為情感分析領(lǐng)域先驅(qū),來(lái)自伊利諾伊大學(xué)芝加哥分校的劉兵教授也表示,用詞庫(kù)法更容易修正錯(cuò)誤。
02
衡量心理健康
雖然情感分析通常屬于計(jì)算機(jī)科學(xué)家的職權(quán)范圍,但它在心理學(xué)中有著深厚的根基。1962年哈佛大學(xué)心理學(xué)家菲利普-斯通開發(fā)了General Inquirer,這是第一個(gè)用于心理學(xué)的計(jì)算機(jī)通用文本分析程序。20世紀(jì)90年代,社會(huì)心理學(xué)家詹姆斯·彭貝克開發(fā)了一個(gè)運(yùn)用語(yǔ)言學(xué)調(diào)查和單詞計(jì)數(shù)的早期情感分析程序,用于觀察人們的心理世界。
這些早期的評(píng)估揭示并證實(shí)了專家們長(zhǎng)期的觀察,即抑郁癥患者有獨(dú)特的寫作風(fēng)格:例如他們會(huì)更經(jīng)常地使用代詞“I”和“me”,更多使用有消極影響的詞語(yǔ),言語(yǔ)里還會(huì)提及更多與死亡相關(guān)的詞語(yǔ)。

抑郁癥患者有著獨(dú)特的寫作風(fēng)格。圖片來(lái)源:Pexels
通過(guò)分析社交媒體帖子,研究人員正在探究言論和寫作中表達(dá)的心理健康狀況。丹佛斯和哈佛大學(xué)心理學(xué)家安德魯-里斯分析了抑郁癥或創(chuàng)傷后應(yīng)激障礙患者在被診斷之前的Twitter帖子,他發(fā)現(xiàn):抑郁癥的跡象早在九個(gè)月前就開始出現(xiàn)了。Facebook有一個(gè)專門的算法來(lái)檢測(cè)那些有疑似自殺風(fēng)險(xiǎn)的用戶,并由人工專家來(lái)審查這些案例,如果有必要會(huì)向用戶發(fā)送提示或提供熱線號(hào)碼。
然而,社交網(wǎng)絡(luò)數(shù)據(jù)距離用于病人的護(hù)理還有很長(zhǎng)一段路要走。隱私是一個(gè)明顯的問(wèn)題,此外還需要更多工作來(lái)證實(shí)有效性。西北大學(xué)的人本計(jì)算(譯者注:一種結(jié)合計(jì)算機(jī)科學(xué)和社會(huì)科學(xué)的系統(tǒng)工程方法論)專家史蒂夫·錢斯勒,她是一份針對(duì)75篇此類研究審查報(bào)告的共同作者,認(rèn)為許多評(píng)估心理健康的研究未能正確定義他們的術(shù)語(yǔ),或者沒(méi)有提供足夠的信息來(lái)重復(fù)結(jié)果。但她仍然認(rèn)為情感分析對(duì)醫(yī)療是有幫助的,比如可以對(duì)新病人進(jìn)行分流。而且即使沒(méi)有個(gè)人數(shù)據(jù),情感分析也能識(shí)別出一些趨勢(shì),如新冠期間大學(xué)生的總體壓力水平,或引發(fā)反復(fù)性飲食不規(guī)律的社交媒體互動(dòng)類型。
03
讀懂情緒
情感分析也在用于解決一些輕松的問(wèn)題,2016年柏林馬克斯·普朗克人類發(fā)展研究所的尼克·奧布拉多維奇分析了Facebook上約20億條推文和Twitter的10億條推文,研究了天氣對(duì)情緒的影響。25毫米的降雨使人們的幸福感降低了約1%,而零度以下的溫度使其降低了大約2%的幸福度。在一項(xiàng)后續(xù)的研究中,奧布拉多維奇及其同事通過(guò)Twitter來(lái)了解人們對(duì)氣候變化的感受,發(fā)現(xiàn)了一些令人沮喪的結(jié)果。他們發(fā)現(xiàn)在連續(xù)五年全球變暖后,推特用戶的一般意識(shí)發(fā)生了變化:他們不再在推特上談?wù)摎夂蜃兣?。盡管如此,數(shù)據(jù)顯示用戶的幸福感仍然受之影響。“這就像溫水煮青蛙,”奧布拉多維奇說(shuō),“這是我所做過(guò)所有論文中最令人不安的經(jīng)驗(yàn)性發(fā)現(xiàn)之一?!?/span>
周一作為每個(gè)星期最糟糕的一天已然臭名昭著。盡管如此,丹佛斯的Hedonometer對(duì)推文的早期分析發(fā)現(xiàn),星期二實(shí)際上才是人們情緒最低落的一天。當(dāng)然,周五和周六是最快樂(lè)的日子,這自然無(wú)需多談。然而在2016年美國(guó)大選之后,每星期的情緒模式發(fā)生了變化。雖然每周的情緒循環(huán)依然保留,但人們的注意力在此之外被其他事情所吸引,話題度甚至超過(guò)了生活的一般要素。丹佛斯表示:“在Twitter上,政治話題永不停歇,一周中任何一天都可能是最失意的一天。”
另一個(gè)受到驗(yàn)證的理論是,在音樂(lè)中,大和弦被認(rèn)為比小和弦更歡快。印第安納大學(xué)的計(jì)算社會(huì)科學(xué)專家安永燁通過(guò)分析12.3萬(wàn)首歌曲中每個(gè)和弦所伴隨歌詞的情感來(lái)測(cè)試這一理論,結(jié)果發(fā)現(xiàn)大和弦確實(shí)與快樂(lè)的歌詞密切相關(guān),在9分制中得分6.3分,超過(guò)小和弦的6.2分,雖然這個(gè)差異看上去微不足道,但在Hedonometer的計(jì)量維度上,是圣誕節(jié)和正常工作日之間情緒差異的也僅有0.2分。安永燁還比較了不同的音樂(lè)流派,發(fā)現(xiàn)1960年代的搖滾樂(lè)是在情緒上是最快樂(lè)的,而重金屬相比是最消極的。
04
商業(yè)敏銳度
商業(yè)世界也在廣泛使用情感分析,但許多公司并不會(huì)公開討論,所以準(zhǔn)確衡量其受眾程度很難。劉兵介紹道:“微軟、谷歌、亞馬遜......每個(gè)公司都在做,有些公司還有多個(gè)研究小組?!币粋€(gè)容易獲得的衡量標(biāo)準(zhǔn)是目前公開的商業(yè)和學(xué)術(shù)情感分析程序的數(shù)量。2018年的一項(xiàng)基準(zhǔn)比較分析詳細(xì)地介紹了28個(gè)此類程序。

情感分析已經(jīng)被企業(yè)廣泛采用。圖片來(lái)源:Pixabay
一些公司使用情感分析來(lái)了解他們的用戶在社交媒體上說(shuō)些什么。有一個(gè)看起來(lái)天方夜譚的例子:加拿大航司Expedia Canada在2013年開展了一次營(yíng)銷活動(dòng),但反響事與愿違,人們討厭廣告中刺耳的小提琴背景音樂(lè)。Expedia很快就發(fā)布了一個(gè)新視頻對(duì)舊廣告進(jìn)行自嘲,他們邀請(qǐng)了一位不滿的推特用戶砸碎了小提琴。人們認(rèn)為Expedia是通過(guò)情緒分析獲得社交媒體反響的。雖然這很難被證實(shí),但這肯定是情感分析可以做到的。
其他有一些公司通過(guò)監(jiān)測(cè)公司內(nèi)部的社交網(wǎng)絡(luò),使用情感分析來(lái)跟蹤員工的滿意度。IBM開發(fā)了一個(gè)名為Social Pulse的程序來(lái)監(jiān)控公司的內(nèi)部網(wǎng)絡(luò),以了解員工在抱怨什么。由于隱私原因,該軟件只查看了在整個(gè)公司公開的帖子。即便如此,這種趨勢(shì)仍然困擾著丹佛斯:“我擔(dān)心的是公司的底線逾越員工的隱私,這在道德上不是無(wú)可指摘的?!?/span>
隨著情感分析變得越來(lái)越普遍,道德問(wèn)題可能會(huì)成為下一個(gè)隱憂。企業(yè)、心理健康專家和任何其他考慮使用情感分析的主體都應(yīng)該牢記,即便情感分析前途無(wú)量,但實(shí)現(xiàn)這一理想仍然是充滿風(fēng)險(xiǎn)的。分析依托的數(shù)學(xué)知識(shí)是相對(duì)容易的部分,困難的實(shí)際上還是理解人類。正如劉兵所說(shuō),“我們甚至不明白什么是真正的理解”。
版權(quán)聲明
本文授權(quán)翻譯自Annual Reviews 旗下雜志 Knowable Magazine,點(diǎn)擊文末閱讀原文可訂閱其英文通訊。
Annual Reviews 是一家致力于向科研工作者們提供高度概括、綜合信息的非營(yíng)利性機(jī)構(gòu),且專注于出版綜述期刊。
原文標(biāo)題“How algorithms discern our mood from what we write online”,作者Dana Mackenzie,發(fā)布于2020.09.14 Knowable Magazine。鏈接為https://knowablemagazine.org/article/technology/2020/how-algorithms-discern-our-mood-what-we-write-online。