第304章學分報告和考試

貼牆加速垮個批臉梗小宋原文哈哈/說的就是我焦某人/哈哈/xswl/不過設置了近幾個月可見之類的吧/小宋好友也翻不到這條了/不過一些名場麵寢室圈的人/是我們也就是馬飛們/有的截過圖

??———————↓↓↓———————

??天天碰麵就挎著個批臉給誰看呢?

??當初全班我都加了好友，目前3個人不是好友。

??一個太奇怪，被我刪了。

??一個太惡心，我被刪了。

??一個太離譜，把我刪了。

??某天搜察對話框想說事，發現沒好友了寢室圈裏聊天，有我到場立馬變臉或者閉嘴，走廊或者洗漱碰麵，就趕緊加快速度，並且靠邊離你遠遠的，特別明顯的那種。

??湊沙比給臉不要臉，充實的一天最後心情壞了

??———————↑↑↑———————

??最近小宋的動態/哈哈/哦不能說哈哈/要說挺搞笑的謝謝你讓我開心/他講的是工作的事

??———————↓↓↓———————

??城市分部壯大，分組，權利分化，我可以接受。

??我不能接受的是，比我晚來的人，在不用處理事務承擔責任時，做出了成績，就不停顯擺自己。

??在還沒有分到我的權利時，就愛搶風頭。問起問題來不管你忙不忙，追著你問。分到我的權利後，更是頻頻不尊重我，你想取代我也太心急了。

??內部競聘宣講時，提問發言自信滿滿，直接問當上以後出差多不多等等，仿佛已經是囊中物。

??你冒犯到我了，我必定會和你爭到底，挫敗你的信心和銳氣，讓你知道該聽誰的。走著瞧。

??———————↑↑↑———————

??2021年3月25日，晴。

??看了一部分早年的小說《死人經》之後我鬱悶的不行，考完普通話才好一點。

??複試好像是線上的。

??2021年3月26日，陰。

??因為畢設想做文本相關的，所以今天找了個文本生成的東西然後我再修改一下看看能否有邏輯。

??———————↓↓↓———————

??《挪威的森林》既是村上春樹的書也是一首歌還是電影。原來生成的是歌詞相關，無所謂了，已經沒有那種世俗的欲望了。

??哦，吳俊琳，

??讓我取下你的心，

??試著慢

??那裏……

??雪白的月亮照耀著地球，

??這段相關歌詞就算了，講個故事

??這是一個關於王子與公主的故事。

??應該就是這個，啊，請聽聽。

??在很久很久以前，在森林的最深處住著快樂的王子和公主，至於為什麽王子和公主住在森林裏我也不知道，不過不妨相信有這麽一對幸福的璧人。當然，是在故事的最後兩人幸福生活在了一起。

??但是故事講完後不久，一個女巫出來了，出於對王子和公主的嫉妒，女巫施了一個咒語：咒語使森林成為許多可怕的障礙，甚至白天也會有濃霧，森林裏野豬變多了，可愛的毛絨兔子少了。

??但是王子和公主沒有承認失敗，盡管他們過得很艱難，他們發明了一種叫做“豬賽跑”的運動，並建立了一個兔子繁殖機構。王子和公主的故事還沒有結束！

??他們在院子裏種了藤蔓——青春和幸福的象征哦，從黎明到黃昏的王子和公主，他們手牽手走進了童話書，最終成為永恒的過去，沒有什麽比既定的過去更加永恒的了，即使是商人的謊言鑽石也比不上曆史的永恒。

??21世紀的街道上不會有女巫，但是生活就像女巫的咒語，讓生活變得更艱難。但是，我的好兄弟，你真的很幸運，你找到了你的女孩，你必須保護她，寵著她，處處聽她的話，否則後果不堪設想，兩個人在一起不容易。唔，兩個人的相處還是不一定要一方順著另一方，相處模式也是因人而異的。世間的事，終歸不能完全套用。

??2021年3月29日，周一，晴。

??焦某人的人！生！大！失！敗！

??焦某人打遊戲黃金沒上反而被封號！

??焦某人開題報告難度爆高導致寫不了！

??焦某人考研複試毫無準備浪費複試報名費！

??焦某人創新學分不夠麵臨學製延畢！

??◆

??■

??◆

??この世界を壊したくなった

??……

??昨天馬飛請室友們出去吃飯，緣由自然是馬飛年滿法定結婚年齡。

??今天，政審表，模擬複試。創新學分材料。開題報告。

??——————————————

??自然語言處理( Natural Language Processing， NLP)是計算機科學領域與人工智能領域中的一個重要方向。

??它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學於一體的科學。因此，這一領域的研究將涉及自然語言，即人們日常使用的語言，所以它與語言學的研究有著密切的聯係，但又有重要的區別。自然語言處理並不是一般地研究自然語言，而在於研製能有效地實現自然語言通信的計算機係統，特別是其中的軟件係統。因而它是計算機科學的一部分。

??自然語言處理主要應用於機器翻譯、輿情監測、自動摘要、觀點提取、文本分類、問題回答、文本語義對比、語音識別、中文OCR等方麵。

??自動生成摘要：Automatic Text Summarization

??文本自動摘要的算法分類

??1.領域相關算法、2.領域無關算法、3.兩者相互融合得到的算法

??兩者相互融合得到的算法分為四種：

??基於統計的自動摘要

??基於理解的自動摘要

??基於信息抽取的自動摘要

??基於結構的自動摘要

??主流的文本摘要方式

??一種是抽取式（extractive），另一種是生成式（abstractive）

??抽取式從原文中找到合適的摘要；（page rank算法）

??生成式理論上的過程：自然語言理解（NLU，Natural Language Understanding）→自然語言生成（NLG，Natural Language Generation）

??實際訓練：Seq2Seq 模型。端到端。ENCODER→Attention→DECODER、Seq2Seq，有監督，有大量的訓練數據。或者transformer，bert基於它。

??文本自動摘要的原理自動摘要係統的處理對象是自然語言文本．尤其是非結構化文本。

??Hobbs曾提出一個信息摘要係統的通用體係結構閉，認為典型的信息摘要係統應當由依次相連的十個模塊組成：

??(1)文本分塊：將輸入的文本分割為不同的文本塊。

??(2)預處理：將文本塊轉換成句子序列，由詞匯項及相關屬性組成。

??(3)過濾：去掉不相關的句子。

??(4)預分析：在詞匯項序列中識別確定的小型結構。如名詞短語、動詞短語、並列結構等。

??(5)分析：通過分析小型結構和詞匯項的序列建立描述句子結構的完整分析樹或分析樹片段集合。

??(6)片段組合：若上步沒有得到完整的分析樹，則需要將分析樹片段集合或邏輯形式片段組合成整句的一棵分析樹或其他邏輯表示形式。

??(7)語義解釋：從分析樹或分析樹片段集合生成語義結構、意義表示或其他邏輯形式。

??(8)詞匯消歧：消解上一模塊中存在的歧義。得到唯一的語義結構表示。

??(9)共指消解或篇章處理：通過確定同一實體在文本不同部分中的不同描述將當前句的語義結構表示合並到先前的處理結果中。

??(10)模板生成：由文本的語義結構表示生成最終的模板。

??並不是所有的信息摘要係統都明確包含所有這些模塊．也未必完全遵循以上的處理順序．但一個信息摘要係統應當包含以上模塊中描述的功能。

??……

??生成式太難了，比較簡單的transformer動輒訓練兩萬個小時也不盡人意。我該怎麽辦？準備弄page rank算法抽取式搞最簡單也是非常難看的文摘生成。

??抽取式摘要是一種比較成熟的方案，其中Text rank排序算法以其簡潔、高效的特點被工業界廣泛運用。大體思想是先去除文章中的一些停用詞，之後對句子的相似度進行度量，計算每一句相對另一句的相似度得分，迭代傳播，直到誤差小於0.0001。再對上述得到的關鍵語句進行排序，便能得到想要的摘要。抽取式摘要主要考慮單詞詞頻，並沒有過多的語義信息，像“豬八戒”，“孫悟空”這樣的詞匯都會被獨立對待，無法建立文本段落中的完整語義信息。

書屋小說首發

第304章 學分 報告和考試

第304章學分報告和考試