短語中的萬花筒

首圖來源:fastcompany

「欸,這好不像你會說的話喔!」

就像認識每個人的聲音和表情一樣,我們對每個身邊的人講話的方式會有一套不同的認知,如果今天有人偷用你的電腦發表文章,或者盜用你的帳號跟你的朋友聊天,很可能會被發現,這講話方式跟你平常不一樣,至於哪裡不一樣,大多人統稱它為一種說不上來的「感覺」,如果我們把語言當作一塊一塊的小元件,把每個人說過的話當成語言資料 (linguistic data) 來解析的話,這種感覺或許有跡可循。

差不多的句子,交給不同人說,就會有不同的感覺,我們可能覺得某個人講話很客氣、很有禮貌,某些人講話很跩、不留餘地,簡單地說,或許有兩個可能的原因,讓我們可以一窺究竟。第一個原因可能是使用詞彙的不同,當一個人覺得很開心的時候,可能會說開心、快樂,或是直接一點說爽,或是用閩南語強調說送啦,或是裝裝可愛說黑皮加個小愛心等等,都會帶給聽者或讀者不一樣的感受。這些選字除了個人風格之外,也跟談話的情境有關,我們用中研院平衡語料庫的資料舉例,在表達兩個概念相似的時候,不同的文類就造成不同使用情況,如下表所示,在口語表達的時候,我們大多使用差不多這樣口語化的用詞,但同義詞雷同在書面報導的使用頻率就大幅提升。

1 (3)

 

除了這些選字上的不同之外,還有「語氣」上的不同,也就是我們很常說的感覺,這裡指的語氣除了抑揚頓挫之外,還可能來自一些帶有較少語意的短語,這些短語的使用與否,不太影響原句的語意 (semantics),但卻帶給人不同的感覺,簡單地舉下面三句話當例子。

  • 他不太清楚狀況
  • 我覺得他不太清楚狀況
  • 他根本不太清楚狀況

「我覺得」、「根本」這些短語的出現與否,雖然並不改變這句話原本的命題(proposition),但是會影響一句話的語氣,帶給讀者不同的感受,有時候作者會用委婉語 (hedge) 來表達對某個命題的不確定,減低自己對這句話的肯定程度,也減少可能受到的攻擊或質疑等等,也有時候作者會用加強詞 (intensifier)來強調自己的確定程度。使用委婉語可能讓別人覺得你很有禮貌,但用多了可能會被說很假掰,而加強詞雖然讓人覺得很有自信,過度使用之下就變成浮誇,或者很跩、沒禮貌。

如果我們把這些短語用來當作分析材料,不看個人而是看群體在一個平台上怎麼說話的時候,或許能夠了解某個平台的文化,本篇文章用批踢踢PTT八卦版(Gossiping) 跟女孩聊天版 (WomenTalk) 為例子,各用四個委婉語:原則上、好像、應該、可能,以及四個加強詞:根本、絕對、超級、真是,來看看它們在兩個版上的使用情形。

我們以2015年11月的資料來作統計,八個詞的出現頻率以及在版上所有十一月文章的相對詞頻如下表所示:

1 (1)

 

原本預期八卦版的鄉民講話會比女人聊天版上更加直接,也就是說,委婉語的使用應該較少而加強詞應該較多,但數據顯示相較於女人聊天版,八卦版上的文章反而大量使用委婉語,正當我們想拍手感謝上蒼果然我們活在文明有禮的美好社會的同時,忽然想到一個問題,今天如果你打算寫一封信給常常稱讚你、和你有共同興趣的好朋友,以及寫一封信給從小到大對你要求非常嚴格、不希望你犯任何錯誤的老師,哪一封信會有比較多的委婉語呢?於是我們從資料庫裡,隨機抽取了兩個版上的推文及噓文各五萬筆,用版上「同儕」的說話方式,來了解為什麼會有這樣不同的使用情形。

1 (2)

 

各位看倌,您看出了什麼端倪了嗎?

訊息萬變的年代,語言的表達也在迅速變遷。大文本數據裡其實到處佈滿著小品文。愈來愈多的人類溝通訊息都要壓縮在愈來愈少的語言載體。看看 twitter, FB 的短文風,以及各式各樣的流行短講,就可以了解為什麼連文本挖掘的會議(參考 http://microposts2016.seas.upenn.edu/topics.html)的主題都變成 “Big things come in small packages” 這樣的口號。讓我們拭目以待,一個簡約新世界。

文章內容屬作者個人觀點,不代表本站立場

台大語言所蘿蔔實驗室

一 位年輕時的憤青,化身於台大語言所的阿伯,熱情推動開放語料計畫,思考與實踐語言學和社會之間的連結。建立了計算語言學與人文計算實驗室(LOPE)之 後,研究整合了語言學、認知科學與資料科學。目前研究之餘主攻文本分析與知識挖掘。一個蘿蔔一個坑,有興趣的人都歡迎來跳入填坑。