計算機語言學關(guān)鍵問題研究

時間:2022-01-28 08:21:42

導語:計算機語言學關(guān)鍵問題研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

計算機語言學關(guān)鍵問題研究

摘要:近幾年,隨著產(chǎn)業(yè)界人工智能領域應用服務不斷落地,學術(shù)界對于AI分支科學的研究也愈加深入。NLP,即自然語言處理,在信息時代向智能時代的過渡中發(fā)揮著極其重要的作用。由此衍生出的一門高度交叉的新興學科,計算機語言學,也正在進行著突飛猛進的發(fā)展。自然語言處理是計算機翻譯的過程,涉及數(shù)據(jù)挖掘、知識圖譜、機器學習及與語言計算相關(guān)的語言學等研究。中文自然語言處理是以轉(zhuǎn)換自然語言為基本原則,遵循基于規(guī)則、基于統(tǒng)計等研究思路,并且適當添加一些可靠的實例來完成翻譯過程。本文我們將圍繞計算機在處理中文自然語言方面的問題來展開分析,通過詳細的分析了解一下中文自然語言處理的基本概念,再來研究一下中文自然語言處理的關(guān)鍵問題與步驟。

關(guān)鍵詞:自然語言處理;自動分詞;機器學習;語言學

一、針對于中文自然語言處理含義的分析

語言是人傳遞信息的關(guān)鍵因素,其本身的復雜性與語言描述外部世界的復雜性,表明機器理解語言是一個艱難的過程。所以說要采取有效手段促使消除語言和交流障礙的信息化,從而通過算法和數(shù)據(jù)模型處理來達到自然語言處理的目的。所謂自然語言處理,包括詞法分析、語法分析、語義分析、篇章理解,通過自然語言處理能夠更好的研究和實現(xiàn)人和計算機之間用自然語言進行有效通信的手段。自然語言處理和語言學的分析研究有著深遠的聯(lián)系,但是也同樣有著一定的區(qū)別。對自然語言處理的研究不是單一的研究自然語言,而是在研究自然語言的基礎上來研究和實現(xiàn)自然語言通信的計算機系統(tǒng)。通過大規(guī)模的數(shù)據(jù)訓練機器,使機器掌握自然語言間的規(guī)則,進行準確的處理與翻譯。自然語言處理問題主要包括了對計算機和人類思維的學習,但是翻譯工作是一項比較復雜的過程,同時也是一種從簡單智能到相對信息化問題的過程,在處理中存在對各種特殊的常識處理存在匱乏的因素,也就導致出現(xiàn)一些語境分析不透徹的情況發(fā)生,進一步也將會影響相應的處理結(jié)構(gòu)[1]。

二、針對于中文自然語言處理與計算機結(jié)合的分析

中文自然語言處理就是對漢語中的漢字等自然語言處理翻譯的過程,當前我國相關(guān)研究人員對自然語言處理信息化的研究力度還不夠深入。這是由于中文自然語言處理,相比于英語等有天然分隔符的語言,難度更大。例如,界定單詞邊界的詞法分析任務,也被稱為“中文自動分詞”的任務,是中文語言處理的首要步驟。其中,新詞發(fā)現(xiàn)、歧義切分等關(guān)鍵問題又是基于對語言的理解之上的。下面我們再來詳細了解一下中文自然語言處理技術(shù)發(fā)展的基本現(xiàn)狀,首先我們根據(jù)以GATE為基礎的自然語言處理技術(shù)來展開分析。由于以GATE為基礎的自然語言處理技術(shù)是語言工程學軟件體系結(jié)構(gòu)的基礎,從而一些關(guān)于工程學的語言行為就都是能夠?qū)I(yè)化進行衡量的。在經(jīng)過自然語言處理以及人工交互的處理以后,能夠更加全面的構(gòu)成相應的軟件和應用,最終再通過計算機語言學中的各種工具和計算機科學專業(yè)的可預測性來完成進一步的設施組織[2]。

三、針對于中文自然語言處理關(guān)鍵問題的分析

中文自然語言處理主要體現(xiàn)在中文自然語言信息主題知識獲取瓶頸處理上,因為中文自然語言處理的領域以及時間的處理、對機器翻譯的知識性等都應當進一步結(jié)合這種模式的深度和難度,最后完成中文自然語言處理的傳統(tǒng)信息知識處理。需要注意的是應當根據(jù)語義網(wǎng)來更加直觀的分析系統(tǒng)規(guī)劃的各個流程,然后依據(jù)適應性來適當增加對中文自然語言有關(guān)知識的系統(tǒng)支持和關(guān)注。相關(guān)人員對中文自然語言信息統(tǒng)計機器翻譯模型順利的開展和完成統(tǒng)計工作,能夠有效的對中文自然語言處理的相關(guān)手段提供更多的關(guān)注,根據(jù)當前的翻譯系統(tǒng)來選擇一種比較相近的編碼過程,進而專業(yè)的推出解碼的主要法則。中文自然語言信息統(tǒng)計要合理的從處理技術(shù)的應用中體現(xiàn)出來,在信息理論模型當中完成噪聲處理復雜問題。除此之外,在面對中文自然語言信息處理其他一些問題時,一般情況下都是通過采用中文自然語言信息聚類處理來完成的,在當前現(xiàn)有層次的算法的基礎上合理的來對平面分割算法等手段進行利用,最后通過有效的結(jié)合算法性能共同完成分析過程[3]。

四、總結(jié)

通過上述問題的分析,我們已經(jīng)意識到中文自然語言處理和計算機結(jié)合的重要性和必要性。隨著人工智能相關(guān)技術(shù)的不斷發(fā)展,中文自然語言處理和計算機的結(jié)合問題也將會面臨大量的知識成本,這就要求從中文自然語言的處理、發(fā)展歷程以及傳統(tǒng)處理手段等來進一步對建模的核心問題完成相應的處理。針對于不同類型的限制條件和因素最大限度的達到最優(yōu)的處理效果,并且管理人員和工作人員還可以通過相應的實驗來進行中文自然語言信息的處理,最終實現(xiàn)更精準的效果和目的,更好的推動中文自然語言處理與計算機的結(jié)合。

參考文獻

[1]自然語言處理與中文計算會議征文通知[J].計算機應用研究,2013(2):12-13.

[2]第五屆國際自然語言處理與中文計算會議暨第24屆國際東方語言計算機處理會議(NLPCC-ICCPOL2016)[J].計算機工程與設計,2016(11):111-113.

[3]劉源等著.信息處理用現(xiàn)代漢語分詞規(guī)范及自動分詞方法[M].桂林:廣西科學技術(shù)出版社,1994.

作者:龐宇 單位:北方工業(yè)大學計算機學院