|
Post by nurrmohammad on Apr 2, 2024 3:35:35 GMT
更具體地說,不是整個人類,而是谷歌、微軟等主要科技公司對潛在和商業利益的認識,刺激了這個計畫的發展和培育,造福所有人。 “大數據使得通用模式變得更加必要” 好像所有這些微服務、資料儲存和跨越不同組織的資料層並不是非常困難,現在我們還必須考慮大數據的面向。 現在我已經熟悉了過去和現在,我真的能看到未來嗎?對於我們這些連結數據的愛好者來說,未來會怎麼樣?我們的願望會被承認嗎?我將在接下來的部分中回答這個問題。 全球產生的全球數據以及為什麼我們會深陷其中 作者相信,大數據使通用模式變得更加重要。但數據到底有多大,年復一年的成長速度有多快? 根據趨勢分析平台Exploding Topics的數據,每年產生的 丹麥 電話號碼 數據量高達 120 ZB,令人震驚,其中一項值得注意的聲明指出,“全球 90% 的數據僅在過去兩年就產生了。”這是一個異常龐大的資料量,並且以閃電般的速度猛增!用數學術語來說,這是指數型成長,但它甚至不止於此:我們還需要考慮產生人工智慧。哦。我的。上帝。祝你好運。 結合生成式人工智慧及其對在網路上產生更多數據的影響,以最少的時間和金錢投入,會帶來組合爆炸! 不斷升級的內容創建和快速發布浪潮需要一種與其速度一致的建模方法,並由階乘函數有效捕捉。指數函數不再足夠了——階乘最接近在這個尺度上模擬我們的現實。 指數成長:但我們也需要考慮 GenAI 的影響! 我們在理解模式實現的重要性方面取得了重大進展,但有人可能會說 Google 現在擁有類似 BERT 的設置,並具有MUM、Gemini 等進步。它確實處於自然語言理解的最前線。這為辯論提供了一個有效的論點。 我需要深入研究更關鍵的分析,以發現更好的支持證據:是否有統計數據可以說明模式使用隨時間的增長並表明其發展方向? 讓我們繼續看下一個指標。 研究與報告 我最初的想法是深入研究網路年鑑網站上提供的見解。具體來說,我重點關注了有關結構化資料的部分,值得注意的是,最新的報告是 2022 年的。我在下面提供了螢幕截圖供您參考。 需要強調的關鍵點概括在以下引用: 「儘管機器學習取得了許多進步,特別是在自然語言處理領域,但它仍然勢在必行 以機器可讀的格式呈現數據。
|
|