如果你研究過自然語言生成應用內容營銷,你可能遇到過文章旋轉軟件。也被稱為文章重寫,這是一種老式的SEO策略,就像自動反向鏈接一樣,用於不太合法(黑帽)的目的。
自然語言生成使用深度學習創建類似人類的可讀文本,一篇基於語言預測模型的獨特文章。文章微調工具采用原始文章,通過替換特定的單詞、短語或句子,生成一個或多個變體。
在這篇文章中,我們看看旋轉軟件是如何工作的,它們的用例,以及它與自然語言生成(NLG)的區別。我有很多理由不允許使用文章旋轉器,所以,把這篇文章看作是一個公共服務公告。
如何使用旋冠器?
了解文章的最佳方法是通過查看用於營銷這些產品的語言。以下是一些試圖銷售旋轉器軟件的網站的引用:
- “即時推出任何文章的獨特版本。”
- “在幾分鍾內生成數百篇新文章。”
- “大量生產內容。”
- “創造大量的內容來幫助你的網站更好地排名。”
有些公司甚至試圖利用人工智能趨勢,聲稱他們的軟件是人工智能驅動的。他們使用人工智能術語來描述自己的產品,有時甚至會編造術語。
“模擬自然語言”是我最喜歡的假詞。我不騙你。有人編的,但不是我!這聽起來很複雜,但毫無意義。
根據所使用的語言,您可能可以猜測部署文章微調器的情況類型。通常它們隻用於低質量的網站為搜索引擎優化目的而創建同時保持文章寫作成本盡可能低。
對於這些類型的博客來說,創建可讀的文本在優先級列表中是很低的。相反,他們的目的是創建一個鏈接網絡,以提高主要“金錢”網站的排名。
發布高質量的內容並不是我們努力的目標。“獨特內容”是指任何足以通過自動搜索引擎剽竊檢查的內容。
如果你想知道萬維網是否真的需要更多這樣的內容,答案是否定的!
文章轉輪是如何工作的?
與NLG相比,內容旋轉器是原始的。他們取一段內容,創造一個變體,試圖讓它看起來好像是一篇獨特的文章。這是通過替換單詞、短語、句子,偶爾也替換段落來實現的。
早期的文章旋轉嚐試導致文章無法閱讀。問題是他們無法識別上下文或詞性。因此,替換最多是奇怪的,而且經常是錯誤的。內容當然不是原創的。
下麵是使用前一段作為示例的文章旋轉器的準確輸出。
重複的內容是黃色的。錯誤的替換用紅色表示。可接受的替換用綠色表示。
所以,67.5%的文章是重複的內容,與原文沒有變化。7個替換品中有6個質量較差,隻有一個可以接受。
劣質的衍生內容是文章旋轉的標誌。
雖然一些較新的文章聲稱使用人工智能,但這真的有點言過其實了。充其量,他們可能在使用穀歌的自然語言API提取標記和句子,以及詞性標記。這是自然語言處理(NLP)的一部分,但正如我們將看到的,自然語言生成需要更多的東西。
無論你怎麼看,文章旋轉仍然是一個從原作中衍生出作品的過程。
不要意譯
鑒於文章轉述的負麵含義,一些文章轉述工具已經將自己標榜為釋義工具。別被騙了。我所見過的釋義工具的運作方式與文章編輯器完全相同。
你自己看吧。
上麵的輸出來自一個免費的釋義工具,其中我使用了與前一節相同的原始文本。突出顯示的文本表示已被替換的單詞。
我把原文和改寫版都看了一遍語法;您可以在下麵看到結果。
使用這種“轉述”工具會讓你失去條理和參與度。這與意譯的目的完全相反。
自然語言生成是如何工作的?
與文章重寫不同,自然語言生成不需要原創內容。它創造了全新的內容,而不是重寫現有的文章。
NLG要麼采用基於規則的方法,要麼依賴統計語言建模。這兩種方法都可以利用NLP和自然語言理解(NLU)技術來提高生成文本的質量。
NLP使用(PoS)標記和實體識別分析文本,而NLU利用NLP和深度學習來創建語義模型,從而獲得意義。
NLG與文章旋轉軟件的區別
不管寫文章的人自稱有多高級,它們不能生成文本-隻需要改變它。這種類型的工具需要一個現有的博客文章,它隻能產生一個衍生品。
他們不創造,他們隻是修改。因此,它不適合內容營銷人員希望在不增加成本和複雜性的情況下擴展內容生產並保持質量。
這些可憐的人中最好的可能會使用一些有限的自然語言處理在替換單詞時做出更好的選擇。但稱其為人工智能有些牽強。
編者注:這是一篇由營銷AI研究所合作夥伴讚助的博客文章BETVlCTOR1946伟德MarketMuse.
Stephen Jeske
Stephen領導MarketMuse的內容策略博客,這是一個人工智能內容情報和策略平台。