2023年毫無疑問是生成式AI爆發(fā)式發(fā)展的一年,以ChatGPT為首的生成式AI技術在全球點燃研發(fā)浪潮,大語言模型迅速席卷全球科技界。進入2024年,生成式AI注定仍將成為全球關注的焦點,有望將我們帶入一個繁榮的新興產業(yè)時代。然而,AI帶來的風險不容小覷,生成式AI的可信度、隱私保護、安全性等問題亦引發(fā)空前爭議。
數據隱私日作為一項全球倡議,是對數據安全和隱私保護不斷變化的挑戰(zhàn)的重要提醒。隨著全球范圍內數據泄露事件的激增,尤其生成式AI在越來越多的企業(yè)中被廣泛采用,該倡議變得愈發(fā)重要,企業(yè)也在不斷加大數據隱私領域的投入。根據Gartner的預測,到2024年,大型企業(yè)機構的年均隱私預算將超過250萬美元。
可信AI的關鍵在于可信數據
鑒于生成式AI取得革命性突破,各行各業(yè)爭相布局,涌入產業(yè)創(chuàng)新快車道。根據IDC預測,到2026年,中國40%的企業(yè)將掌握生成式AI的使用,共同開發(fā)數字產品和服務。其中,聊天機器人、自動報告生成和個性化電子郵件都是生成式AI推動創(chuàng)造力和生產力并改善客戶體驗的典范。然而,值得注意的是,人工智能/機器學習模型的質量取決于它們所訓練的數據。因此,打造可信AI的關鍵是擁有可信數據。
隨著企業(yè)希望在整個業(yè)務中部署更多的人工智能和機器學習(ML)技術,對可靠數據平臺的需求在不斷增加,以幫助其跨所有環(huán)境訪問數據。AI/ML的技術發(fā)展甚至讓企業(yè)能夠從非結構化數據中提取價值,這使得所有數據的管理、治理和控制變得至關重要。如果企業(yè)數據平臺內擁有可信的數據,那就為建立AI大模型奠定了基礎。
此外,越來越多的企業(yè)希望實現數據民主化,即降低數據訪問門檻,授權合適的員工訪問合適的數據,以此提升運營效率。當數據的邊界擴大,對于數據隱私和安全治理也提出了更高的要求。
為了確保AI生態(tài)朝向正確的軌道健康發(fā)展,需要不斷完善的立法支撐。近年來,我國陸續(xù)頒布實施了《網絡安全法》《數據安全法》和《個人信息保護法》等法律法規(guī),組成了數據安全領域的“三駕馬車”。在此體系基礎上,數據安全和隱私保護得到了政策和市場需求的雙重推動,產業(yè)正處于快速增長階段。
現代化平臺成為數據隱私的“安全保鏢”
基于日益完善的法律法規(guī),企業(yè)也必須不斷發(fā)展自身的數據系統(tǒng)以滿足數字時代的新需求,重新思考他們所采取的措施,來確保數據的隱私安全。為了應對數據安全和隱私風險,企業(yè)必須在制定戰(zhàn)略和計劃時將數據安全和治理放在首位。投資具有內置安全和治理功能的現代化數據平臺和工具,可以幫助企業(yè)以安全和符合監(jiān)管要求的方式實現數據民主化,同時成功訓練企業(yè)人工智能/機器學習模型。
總之,數據隱私問題變得愈發(fā)復雜,如果不及時采取現代化措施保護數據安全,可能導致企業(yè)面臨法律、金融和聲譽等風險。企業(yè)需要將數據隱私嵌入到其運營結構中,將其作為核心功能,并通過人員、流程和企業(yè)數據管理技術來提供支持,以確保其客戶、合作伙伴和最終用戶的數據隱私得到保護。而且,數據隱私保護必須成為一種主動的戰(zhàn)略性功能,主動防御而非在數據泄露之后進行補救。
Cloudera建議采用六步方法來構建安全的數據基礎——找到數據、加密、管理、溯源、檢索、以及發(fā)送警報。無論數據位于何處,Cloudera都能幫助客戶檢索和定位所有數據,并通過令牌化或加密來保護數據。此外,通過數據溯源,能夠輕松進行審計跟蹤和訪問控制,確保合適的人訪問合適的數據。一旦發(fā)現有違規(guī)行為,便會立即發(fā)送警報,阻止企業(yè)數據被不正當使用。
Cloudera的數據平臺(CDP)使構建、部署和管理機器學習應用變得更快、更容易,而且更安全。通過降低成本和簡化操作,CDP減少了在整個企業(yè)中引入新數據隱私用例所需的時間,其安全和治理功使企業(yè)能夠在公有云、本地和私有云中的任何地方控制數據?;谶@樣的現代化數據平臺,企業(yè)將能夠獲取完整、可信的數據,進而利用人工智能加速業(yè)務創(chuàng)新與安全轉型。