疫情下的情人節,疫情防護語料庫助你靠譜保護你愛的人

 程剛byr
發布于 2020年02月14日
收藏 3

疫情下的情人節,疫戰2020助你靠譜保護你愛的人

愿得一人心,白首不相離。今天,2月14日,是萬千情侶翹首以盼的情人節。但因為疫情,我們不能出門歡聚;因為疫情,我們不能花前月下;因為疫情,我們不能去做太多我們想做的事兒……

自疫情以來,我們的中央政府做了很多的部署抗擊疫情,各大公司開發了很多和疫情有關的工具,海內外的各界人士紛紛捐款捐物抗擊疫情,各地的志愿者紛紛成立各種小組服務大家。疫情的發展牽動每一個中華兒女的心,涌現出了許多可歌可泣的感人事跡。

我們都知道,新型冠狀病毒肺炎的最大特點是傳染性強,潛伏周期長。我們是一個有著14億人口的大國,每個人都需要做好疫情防護工作,為自己負責,為家人負責,更是為國家和社會負責。千里之堤潰于蟻穴,一點點的疏漏就會給疫情防治帶來巨大的挑戰。

然而,口罩該怎么選擇?在醫療物資緊缺的當下,有什么辦法來提高口罩的利用率?經常要去醫院該怎樣做防護?家里有老人孩子需要做哪些事情?復工在即,怎樣防護才安全?出入公共場所又該怎樣防護?怎么正確選擇和使用消毒產品?身體不適,擔心自己中招,該怎樣求助?自己周邊有哪些地方確診了病例?國家發布了哪些疫情有關的措施?如此這般,一系列問題擺在了大家的眼前。如何在浩如煙海的信息中快速地找到這些問題的靠譜答案呢?

我們看到有很多的文章在傳播錯誤的防護知識;我們看到權威機構發布的疫情防護手冊內容需要被更多人使用;我們看到疫情有關的各種工具散落于網絡中不能被一站式獲取,我們看到很多人因為疫情陷入焦慮中;我們看到國務院針對疫情熱點問題的權威回應需要方便獲得。

我們可以做點什么呢?

我們認為權威可靠的疫情防護知識應該傳遞給每一個人;我們認為國家及各單位開發的疫情工具應該一站式提供給每一個人;我們認為普通百姓應該通過簡單的問答方式獲得準確的權威答案。

經過深入的思考,我們決定做一個關于新型冠狀病毒疫情防護的開源語料庫。如果把智能問答機器人比喻成汽車,語料庫就是汽車啟動需要的油。沒有油,車是無法啟動的,沒有語料庫,智能問答機器人是不能工作的。人工智能近幾年如火如荼,有非常多的公司和科研機構在從事相關研究。我們的目標是提供一個權威可靠的疫情防護語料庫開放給這些公司和科研機構。這些公司和科研機構,可以基于該語料庫發布各自的疫情安全防護問答機器人,提供給他們的用戶使用。

因為是做疫情相關的語料庫,對用戶的生命健康有重大影響,所以我們對語料的來源進行了精心甄選。我們只采用來自國家權威機構發布的資料,如國務院的中國政府網發布的權威回應、中國疾病預防控制中心發布的《新型冠狀病毒感染的肺炎公眾防護指南》、中國醫學科學院北京協和醫學院的相關專家編寫的《協和新型冠狀病毒肺炎防護手冊》、人民日報的相關問答等。

除疫情防護的知識語料外,疫戰2020疫情防護語料庫還整理了疫情相關工具的語料,如國務院疫情督查、征集肺炎求助者、密切接觸者測量儀、疫情實時地圖、疫情心理援助電話、防疫物資供求等疫情工具。

疫戰2020疫情防護語料庫是由用友員工白清杰發起的個人公益項目。語料由志愿者根據國家權威機構發布的資料共同編輯整理完成。志愿者有來自北師大、北航、北郵、浙大、重大、武漢理工等高校的學生和老師,有來自上海計算所、共致開源等組織的熱心人士。志愿者在很短的時間自發自愿的聚集在一起,借助網絡的力量分工協作,通過眾包方式完成語料庫的整理。百科名醫的CTO趙鑫磊先生提供了大量技術支持。

我們是臨時拼湊起來的一個志愿者團隊,起初只有兩三個人,后來變成十幾個,幾十個。我們都沒有語料整理經驗,愛因互動提供了語料建設規范,對志愿者進行了培訓,幫助志愿者構建對智能問答服務友好的知識庫。

語料庫的整理工作是非常枯燥乏味和艱辛的。志愿者們憑著一腔熱情,用業余時間,你一磚我一瓦,夜以繼日地對語料進行豐富完善。我們從3號開始整理,到7號的時候已經初具規模。8號9號,我們組織志愿者進行了集中突擊,整理了大量的語料。11號時,語料建設的第一階段已經接近完工。之后我們組織大量的志愿者對答案進行檢查核對,更新過時的答案,規范答案的格式,我們抓取了百度知道的5000多個疫情相關問題做測試。我們的志愿者將來自百度知道的2200多個問題通過人肉分揀,更新到了我們的語料中。針對疫情實時數據,我們將69種咨詢方式和369個區域,按照排列組合方式,將生成的超過25000多個問題,加入到了語料中。我們精心挑選了一些和疫情防護有關的短句,附在每一條答案的后面,幫助更多的人了解如何做好安全防護。

為了傳遞權威可靠的疫情防護知識,為了傳遞國家權威機構發布的疫情政策和措施,為了向所有人提供一站式的疫情防護服務,經過志愿者們近半個月的努力,經過和各個合作機構的協同作戰,疫戰2020公益小組聯合用友、微信開放平臺、愛因互動、開源社、句子互動等多家企業及社會組織,共同向社會發布疫情防護智能問答服務。這是我們送給全國人民的情人節禮物。

首先,我們感謝參與項目的50多位志愿者,感謝所有為這個項目貢獻過力量的人!

感謝所有支持我們的合作伙伴,感謝他們向社會發布疫情防護智能問答服務!

感謝我所在的單位用友對我所做的這個公益項目的支持!

用友旗下協同平臺友空間,面向所有企業及組織提供統一數智化工作入口、協同辦公、社交溝通、業務協同等核心解決方案。友空間內置智能機器人“小友”,搭載了疫情防護問答服務。用友人工智能團隊基于該語料庫發布了疫情智能問答API,該API發布在了用友APILink開放平臺上,API免費向社會開放。

微信對話開放平臺是騰訊微信AI團隊打造的一款智能對話機器人配置平臺,為疫情助手機器人提供了強大的自然語言處理的技術支持。同時,利用微信對話開放平臺的開放能力,將疫情助手機器人相關的技能開放到了平臺內技能商店中,可供所有開發者免費使用,助力其在公眾號、小程序以及第三方web、app等渠道,為有需要幫助的廣大群眾提供更加方便的疫情查詢渠道。微信AI團隊秉持“以人為本,科技向善”的理念,聯合所有開發者,用AI的方式,為抗擊疫情作出一點綿薄貢獻。

開源社基于該語料庫發布疫情智能問答服務,目前已在開源社微信公眾號后臺提供服務,開通了和開源社疫情微信聊天機器人服務。句子互動為微信聊天機器人提供接入服務和技術支持,后臺的智能對話平臺,由微軟(亞洲)互聯網工程院的商業人工智能團隊提供技術支持以及Azure云資源。

愛因互動作為第一家向項目提供對話機器人技術支持的公司,派出了產品經理和工程師給予支持。愛因互動使用志愿者建設的語料,訓練智能問答機器人模型,向公眾免費提供疫情知識問答機器人服務。

句子互動是一家基于微信生態,為企業提供營銷銷售自動化和社群管理工具的公司。配合微信對話開放平臺,快速創建了疫情小助手,用戶添加疫情小助手為好友后,私聊直接提問或添加進入任意群并@小助手,小助手便可回答關于疫情相關的問題,緩解用戶緊張情緒。同時,句子互動也將功能集成到管理系統中,方便企業快速集成,為公眾提供疫情知識問答服務。

疫戰2020疫情防護語料庫基于木蘭寬松許可證第2版(MulanPSL v2)開源,社會各界都可以基于該語料庫,發布疫情智能問答服務和API,共同為抗擊疫情而戰斗!疫戰2020也需要更多的志愿者參與完善該語料庫。

豈曰無衣、與子同袍,王于興師,修我戈矛。

在這個美好浪漫的日子,我們向戰斗在抗擊疫情一線的醫務工作者和社會各界人士致敬!一切終將過去,我們靜待春暖花開!

本站文章除注明轉載外,均為本站原創或編譯。歡迎任何形式的轉載,但請務必注明出處,尊重他人勞動共創開源社區。
轉載請注明:文章轉載自 OSCHINA 社區 [http://www.unfhffyc.icu]
本文標題:疫情下的情人節,疫情防護語料庫助你靠譜保護你愛的人
加載中
返回頂部
頂部
真人龙虎斗论坛