有沒有辦法比較sql中句子之間的相似度?我有很大的資料集,我需要識別有相似句子的實體。在我的資料集中有多個彼此相似的句子。

我如何告訴 SQL 只回傳下面的值?

從我在 google 上搜索的內容來看,可能有一種方法可以使用全文搜索和語意搜索來做到這一點,但我已經能夠找到一篇文章來解決我想要實作的目標。
小組中的某個人可以為我提供示例或指出可以幫助我的文章嗎?更好的是,我正在嘗試做的甚至可以在 SQL 中實作。
uj5u.com熱心網友回復:
您可以嘗試 SOUNDEX 功能。谷歌 SOUNDEX,然后了解這是否適用于您的情況。查詢是:
SELECT *
FROM your_table
WHERE SOUNDEX(Sentence) = SOUNDEX(Sentence);
uj5u.com熱心網友回復:
不,那里沒有。
部分問題在于“相似性”是一個復雜的設定,這需要一個程式來分析句子 POSSIBLY 與數月的編程。你給出了非常簡單的例子 - grats。即使那也沒有你想象的那么容易。“小男孩穿紅色T恤”怎么樣——小男孩會不會有所不同?
這需要大量的作業和大量的定義,或者對可能的多層神經網路進行大量的訓練。
SQL 通常在字串操作方面很糟糕——你得到的最好的是 SOUNDEX,它只比較第一個單詞的 4 個字母(RTFM,它的作業方式實際上非常有趣,但它絕對不適合比較句子之類的事情。
所以,不 - 這完全超出了 SQL 中的任何范圍,您將不得不下載資料并使用 SQL 之外的方法(這也更適合此類作業)。
您顯然可以使用簡單的 SQL 來解決這個問題,例如@ASH 所建議的 - 但這不是在尋找“類似的句子”,而是在解決特定于您的資料集的特定標記。這是過度擬合并繞過回答您提出的問題。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/350604.html
標籤:sql sql-server 全文索引
