在今天的AICC 2021人工智能計算大會上,浪潮信息正式宣布,全球最大中文人工智能巨量模型“源1.0”正式開源。
“源1.0”是浪潮人工智能研究院發布的人工智能巨量模型,單體模型參數量達到2457億,超越美國OpenAI組織研發的GPT-3模型,成為全球最大規模的中文語料AI巨量模型。作為通用NLP預訓練模型,“源1.0”能夠適應多種類的AI任務需求,降低針對不同應用場景的語言模型適配難度,并提升小樣本學習與零樣本學習場景的模型泛化應用能力。
“源1.0”將面向學術研究單位和產業實踐用戶進行開源、開放、共享,降低巨量模型研究和應用門檻,推進AI產業化和產業AI化進程,為人工智能研究創新和產業發展做出貢獻。
去年,涵蓋 1750 億參數的 GPT-3 一經發布,引發大眾驚呼“GPT-3可以改變世界了”。而浪潮信息發布的“源1.0”被稱為“全球最大規模的中文人工智能巨量模型”,參數規模高達2457億,訓練采用的中文數據集達5000GB,最大規模中文高質量數據集,獲得中文語言理解評測基準CLUE榜單的零樣本學習和小樣本學習兩類總榜單第一名,模型能力大幅度提升。
據介紹,“源1.0”可以創建任何具有語言結構的東西,可自動問答,撰寫文章、詩歌、小說、新聞報道,翻譯語言,還可以寫代碼。最關鍵的是,“源1.0”可以理解文字的含義,從中抽取關鍵信息,做出回復,回復的詩句富含感情,其創作能力、學習能力表現不俗。
在人機對比測試中,將“源1.0”模型生成的對話、故事、新聞、詩歌、對聯與由人類創作的同類作品進行混合并由人群進行分辨,測試結果表明,測試人員準確分辨人與“源1.0”作品差別的成功率已低于 50%。
如此一來,“源1.0”可用于智能客服、文字識別、文本搜索、翻譯、智能運維、智能助手等應用中。以智能客服為例,可感知客戶的情緒,以便更好地理解客戶的需求,提供更人性化的服務。
巨量模型的發展備受關注。斯坦福大學李飛飛教授等人工智能領域知名學者近期在論文中表示,這類巨量模型的意義在于突現和均質。突現意味著通過巨大模型的隱含的知識和推納可帶來讓人振奮的科學創新靈感出現;均質表示巨量模型可以為諸多應用任務泛化提供統一強大的算法支撐。
“源1.0”中文巨量模型的發布,使得中國學術界和產業界可以使用一種通用巨量語言模型的方式,大幅降低針對不同應用場景的語言模型適配難度;同時提升在小樣本學習和零樣本學習場景的模型泛化應用能力。
開源開放計劃官網:air.inspur.com
浪潮信息副總裁、浪潮信息 AI & HPC 產品線總經理劉軍表示,如今算力正在助推中國人工智能產業快速發展,技術、區域、行業、應用場景等多個維度都在加速發展。其中智算呈現多元化、生態化、巨量化的發展趨勢。
-
多元化:2021年全球 AI 芯片廠商超 150 家,NPU、IPU、VPU、TPU、DPU、GPU 等 AI 計算芯片百花齊放。多元化的芯片發展為產業 AI 化的加速提供了重要的產業基礎和更加多元化的選擇,但如何讓多元算力走向產業,實現算力普適普惠的關鍵。
-
生態化:開放生態造就產業繁榮。對此,為推進算法基礎設施建設的發展,浪潮信息在大會上公布 “源1.0”開放開源的計劃,為降低巨量模型研究和應用門檻,推進AI產業化和產業AI化進程,“源1.0”面向學術研究單位和產業實踐用戶進行開源、開放、共享。目前的合作內容涵蓋模型API、高質量中文數據集、模型訓練代碼、模型推理代碼、模型應用代碼等。
-
巨量化:模型和使用量巨大,如國外 OpenAI、微軟、谷歌、英偉達等企業均在發力“大模型”,如微軟聯手英偉達推出的 5300 億參數“威震天-圖靈自然語言生成模型(Megatron Turing-NLG)”。
談及未來,浪潮信息表示,后續“源2.0”的發展將往多模態、視覺領域開展。
- Facebook正式改名Meta,扎克伯格All in元宇宙,開啟新征程;
- 微軟加入元宇宙大戰:將Mesh直接植入Teams中,將不同元宇宙粘合起來;
- 中科深智完成B輪融資,利用AI技術打造元宇宙內容生產中臺。
-
全球第一!阿里達摩院AI訓練模型M6參數破10萬億,遠超谷歌、微軟; - 微軟宣布推出Azure OpenAI服務,為開發者帶來GPT-3模型,幫助企業建構更聰明的應用;
- 全球最大規模人工智能巨量模型 “源1.0”正式開源!2457 億模型參數,超越美國GPT-3模型。
3.AI人物:
