每日經濟新聞 2016-10-21 00:35:46
每經編輯|每經記者 左越
◎每經記者 左越
近期,由每日經濟新聞主辦的“2016中國上市公司口碑榜”,攜手獨家輿情大數據服務提供商慧科訊業,共同發布了中國資本市場首份輿情大數據榜單——2016上市公司輿情榜,獲得業內各方的廣泛認可與關注。
值得一提的是,未來最終登上“2016中國上市公司口碑榜”9大榜單的獲獎公司,也將從輿情榜單排名靠前的400位公司名單中產生。
那么,這份萬眾矚目的輿情榜單是如何出爐的?背后又隱藏著怎樣的故事?今日,每日經濟新聞為您揭秘,這一份含金量十足的榜單,究竟是怎樣出爐的。
總體來說,2016上市公司輿情榜通過梳理多達250萬條的海量輿情信息,并通過十大嚴謹的步驟和指數計算公式的反復推敲,來確保輿情榜單的客觀與公正。
一、新聞大數據積累:
慧科訊業每天24小時全網監測主流中文媒體,在數據庫中不斷積累海量的新聞大數據。
二、媒體信源確定:
根據慧科訊業科學的媒體評級,選定了國內100份最重要的財經類或綜合新聞類媒體,作為本次評選的信源。
三、原始新聞回溯:
慧科訊業研發部根據慧科訊業內部的上市公司關鍵詞表,從過去一年的指定100家媒體的海量大數據中回溯相關新聞約250萬條。
四、新聞屬性判斷標準確定:
從經營狀況是否良好、行業地位、是否遵紀守法、大股東是否信守承諾、獲得哪些榮譽等方面,來確定了每條新聞正面、負面、中性的判斷標準。
五、人工先行判斷部分新聞(輔助AI學習):
隨機抽取部分新聞,供資深財經編輯根據相關標準對6000條新聞樣本進行人工標注(正面、負面、中性),供機器學習。
六、AI(人工智能)學習:
AI根據人工判斷新聞的素材進行學習,不斷調整模型和算法,最終達到理想的準確率和召回率水平。
七、AI大批量判斷:
AI機器對250萬條上市公司相關新聞進行自動判斷(正面、負面、中性),并對機器感到困惑的新聞打上相應的標簽。
八、人工調整:
人工對于標簽有疑問的新聞進行重點檢查,從而完成所有新聞的正面負面中性判斷。
九、確定指數計算標準并排名:
慧科訊業公司媒體管理總監王勤介紹,我們結合媒體評級、新聞總量、正負面凈好評比等參數,制定輿情榜指數計算標準,按此方式進行運算和排名。
簡單地說,根據2800多家上市公司在2015年8月1日~2016年9月18日這段時間在主流財經媒體上的新聞報道來計算和排名的,一家上市公司的正面報道量越多,負面報道量越少,那么排名就越靠前。但只計算凈好評率還不夠,我們引入了新聞量這個因子,讓每家公司的新聞報道量也發揮作用。在計算過程中我們要做一些統計方面的處理,例如會涉及到對數標準化、參數權重、以及將計算結果換算成100以內的數字的映射處理等,最終形成一份完整有價值的榜單。
十、榜單提交及后續追蹤:
未來,慧科訊業還將持續跟蹤輿情,如有入選公司發生重大負面,將及時對2016上市公司輿情榜進行調整。
正是經過250萬條海量輿情信息的科學計算,以及上述十大嚴謹步驟的篩選后,2016上市公司輿情榜最終出爐。接下來,輿情榜中排名靠前的400家公司,將經過南開大學中國公司治理研究院投資者關系管理研究團隊所建立的科學評價模型篩選,以及百家頂級機構的審慎投票,最終誕生“2016中國上市公司口碑榜”九大榜單,135家獲獎公司。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP