您的位置:首頁>新聞 > 業界 >

國盛證券劉高暢:擁抱AI時代的早期階段

2023-04-28 09:46:56    來源:東方財富網

嘉賓介紹:劉高暢,國盛計算機首席、機器人大組組長,2021&2022年新財富計算機行業第一名(首席)。南開大學物理學、金融學雙學士,香港中文大學系統工程碩士。曾任申萬宏源人工智能組組長,計算機高級分析師。

今年一季度,隨著ChatGPT的火爆,前期沉寂多年的TMT板塊出現非常好的表現。資本市場在ChatGPT出現之后為什么這么看好TMT行業?人工智能背后的技術積累和突破的關鍵在哪里?算力和數據方面我們和海外有多大的差距?人工智能產業鏈中,哪些賽道會比較好,后續行情將如何演繹?

國盛證券劉高暢表示,ChatGPT不再是0—1,和應用端結合起來之后已經進入1—N的階段,使得資本市場開始真關注到ChatGPT的價值。大模型的出現是人工智能技術經過積累和發展后,量變產生質變的結果。在當前人工智能巨大變革的產業早期,在算力、大模型、應用這三個領域都有非常好的機會。這一輪人工智能的影響力可能比1999年的互聯網更大,行情的持續性和高度可能會超過預期。


(資料圖片僅供參考)

以下為文字精華:

1、國盛證券劉高暢:ChatGPT應用落地 進入1—N階段

提問:很高興今天能有機會和大家一起交流人工智能以及TMT行業的觀點,我們非常榮幸地請來了國盛證券計算機行業首席分析師劉高暢,劉總是連續兩屆的新財富計算機行業第一名,同時去年年底就非常前瞻地看好人工智能行業。

首先想問一下劉總,計算機行業以及人工智能今年如此好的表現是因為什么?

劉高暢:去年底的時候,我們也看了一下所有賣方的年度策略,我們應該是唯一一個把人工智能列入其中進行推薦的,而且列在核心的推薦里。我們當時的年度策略寫的是信創、數據以及AI三個方向,今年應該來講,驗證程度還不錯。

去年12月份的時候,OpenAI放開了ChatGPT的公測。ChatGPT的對話體系展現的智能性,和以前的AI,包括大家比較熟悉的NLP自然語言處理已經發生了比較大的區別。

首先他能理解你的問題,他的回答非常也很有邏輯和條理,而且他的認知范圍非常廣闊,所以我們當時就覺得這個東西和之前的不一樣。我們在機器人的研究當中發現,機械部分甚至控制平衡的部分,都不是一個機器人最重要的點,要讓機器人真的發揮作用,關鍵在他的“大腦”,這可能是通用人工智能改變世界最缺失的一環。

去年12月份我們用了ChatGPT之后,在12月11日也發布了相關的報告,探討ChatGPT是否是新一輪的科技革命。實話實說,當時我們的認知還略淺顯,并不堅定,只是覺得它的可能性和方向已經出現了,所以我們在年度策略里沒有把人工智能列為第一主線,而是列為三大主線之一。

1月3日,微軟宣布推出New Bing,在New Bing的搜索層面運用ChatGPT。當時給了我們一定的觸動,我們發現ChatGPT不只是一個對話系統,它可以和應用端結合起來。對資本市場來講,我們覺得有兩個點特別重要,讓大家真正開始認可。

第一點,我們和資本市場共同看到,在我們的春節期間,微軟宣布Microsoft的Office全家桶包括微軟的全套體系會接入ChatGPT開發應用。當時中國的資本市場的話也是看到ChatGPT不再只是0—1的過程,它真正開始和整個產業界全面結合起來,已經進入1—N的階段。

之后我們就開始深入研究,看很多的相關論文,我們在2月下旬提出的多模態GPT的方向,甚至領先學術界預判了市場包括產業的下一個重要方向,這一塊研究我們非常的自豪。從當時開始,我們就已經將其作為整個年度最重要的產業。

資本市場特別是對公募保險這樣的一些大機構來說,真正讓他們觸動的,相信是3月16日晚,微軟的Copilot六件套的發布,包括 Word、Excel、PPT等。這個時候,我們發現資本市場真正開始相信了。

因為大家以前覺得它只是一個小工具,不能提升社會生產力,但是做PPT這個工作,應該來講我們每個人都有做過,可能對很多投資者來說非常難受,有這么多的PPT要做,大家經常熬夜做PPT熬得頭發都掉了。但是我們發現ChatGPT接入之后,它真的可以開始幫我們自動生成PPT,雖然還比較粗淺,需要我們大量的修改,但是從中可以明確地感受到ChatGPT的魅力。

從那時開始的話,資本市場無論是機構還是個人投資者,對ChatGPT的關注度快速爆炸,真正的熱了起來。

2、國盛證券劉高暢:第三次AI浪潮 量變產生質變

提問:直到2023年,人工智能中在我們看起來“比較基礎”的人機對話功能才得以實現,背后的技術積累和突破到底在哪里?

劉高暢:2006年以后的AI發展,我們把它列為人工智能的第三次浪潮,它的標志是深度學習的成熟,以深度學習模型的成熟和可實現程度的完成作為標志,像Geoffrey Hinton這樣的一些大牛在里面做出了很多貢獻。

2006年到2017年是以深度神經網絡為代表,包括CNN(卷積神經網絡)、RNN(循環神經網絡)、DNN(深度神經網絡),一些深度神經網絡的分支。

2017年,代表性的模型框架就是Transformer開始出現,它吸取了CNN體系,殘差神經網絡里殘差塊的體系,去解決梯度下降或者梯度爆炸的問題,在循環神經網絡里,它吸取了Self Organizing Maps(SOM,自組織映射神經網絡)。當時是Google的研究團隊提出了Transformer大模型的邏輯,模型規模很大,有的可能是以編碼器為主,有的是以解碼器為主,Google堅持以編碼器為主,這個路線在識別客戶的問題或者識別客戶的需求方面效果比較好,也有利于Google的搜索產品。

OpenAI非常有意思,它看重的是GPT路線,也就是生成式AI的路線。生成式AI,它的復合里面放的都是解碼器,也就是說在訓練之后會有一個特點,就是會有多種多樣的表達,可以按照各種邏輯去表達。

因為OpenAI在早期的目標就是致力于AIGC,也就是通用人工智能的成型,他們認為GPT路線離實現通用人工智能的距離會更近一些,所以一直進行這種訓練發展。從處理數據集到網絡結構的設計,到訓練的布置實施,包括訓練過程中的修正與調教。

中間有個比較意思的點,就是它用大語言模型去寫代碼。這一點非常有意思,當時是GPT3初始模型之后開始去寫代碼,寫完代碼并做了對齊,對齊叫Instruct Lenition,初始的指導中只有少部分的道德指導,大部分做指令的指導,把代碼和人類的語言進行一一對齊。簡單說就是讓機器去理解人類的語言,用代碼的形式去實現一些邏輯上的操作,并且把結果反饋成人類的語言,可以理解為把機器相關的東西進行翻譯。

這個操作完成之后不再叫“GPT3初始模型”,叫“GPT3達芬奇002模型”。我們當時去測,大概是在2021年底,他的表達表現還不是特別好,但是用特殊方式的引導詞去提問他,你會發現他已經具備了非常強的邏輯能力,只是道德水準還有點問題,所以后面OpenAI做了一定的工作,叫做Instruct GPT指導。

指導分為幾個內容,一方面進一步去調教指令,能夠更好地理解人類的一些指令,一些通俗易懂的話怎么轉化成機器的邏輯。

另外一種就是做道德上的調教,因為怕出現一些黃色暴力血腥的話,以及一些反人類反道德反社會的話。就像我們教小孩子一樣,他可能有邏輯也很聰明,但是表達有問題,世界觀價值觀也有問題,我們要去調教他的三觀。

經過Instruct指導性的調教之后,再進行一些微調,行業化和效果的一些調整,到了2012年12月份,發出來的GPT3.5之上的衍生產品,也就是ChatGPT。

GPT3以前用的是公開數據為主,用了很多的開源代碼,也可能用了一些微軟內部比較高階的代碼,這是一種猜想,但總體來說是以公開數據為主,但是未來往行業化的方向去發展,可能專業化的數據,能夠支撐應用形成的數據會相對來說比較重要。

人工智能技術經過不同的積累和發展到了大模型階段,大模型學習了很多人類互聯網上的公開數據形成了自己的智能,是模型規模到了一定程度量變產生質變的結果。

3、國盛證券劉高暢:中文數據欠缺 算力消耗顯著

提問:除了算法,人工智能訓練的時候也需要很大的算力,包括海量的數據,特別是我們中國跟海外的數據源可能還存在一些割裂。在算力和數據方面,我們和海外有多少差距?

劉高暢:數據方面,在GPT3以前用的都是互聯網的公開數據,中文目前來看,客觀的條件就是高質量的語料庫相對來講會稀缺一些。

在整個OpenAI的大模型中,我們了解到中文的語料庫使用只有5%,從誤差率的角度來講,英文可能在2%—3%,中文大概在10%以上。用中文去測試ChatGPT,效果也不如英文。但是,我們也看到國內的高質量語料庫在快速生成中,大家也在探索,包括知乎和萬方這樣的一些高質量語料庫在形成。

大模型的數據還是以互聯網公開數據為主,可能在寫代碼這個階段,一些頂尖大廠比如微軟,代碼的水平會比較高,但是畢竟這一塊只是小部分,我們推測起不了決定性的作用,應該不是特別大的瓶頸。OpenAI在去年GPT3.5的時候,大概用了45TB的數據,做模型數據集處理和傾斜的部分應該是不超過1TB的,所以其實是很少的數據,這一點不用特別擔心。

算力方面,如果從訓練端的角度來看,如果在GPT3以前,用2000張英偉達A100的算力,如果你訓不出來成果,我們建議就不要去做了,說明這個團隊水平有點問題。如果在GPT3.5以前,5000張如果訓不出來,我們建議也不要再做訓練了,說明這個團隊多多少少有點問題。

我們認為在訓練階段,對算力的需求量沒有那么極限,國內明面上和潛在的產業中的儲備我們認為是夠的。

應用端來看,做模型蒸餾和模型裁剪,把算力的消耗做到以前的90%,已經是很高的縮減度了。但是就這樣的情況來看,算力還是會捉襟見肘,對未來算力的消耗還會非常顯著,包括我們國家的一些晶圓代工和設計廠商,這也是他們需要努力的地方,其實是機遇也是挑戰。

4、國盛證券劉高暢:關注三個領域 皆有可觀機會

提問:在ChatGPT或者人工智能產業鏈上,您覺得哪個賽道會比較好?

劉高暢:我覺得在這樣巨大變革的產業早期,算力、大模型、應用這三個領域都有非常好的機會。

算力領域我們也測算過,在應用端來看,如果應用快速擴張的情況下,它的算力需求相較于現在可能是以萬倍為基數的提升,甚至會更高。我們做過一個很有意思的測算,就是通用的人形機器人出現的時候,它的模型規模我們認為至少是3萬億—4萬億的參數級別。

到了三四萬億的參數,即使我們做了很好的模型的蒸餾裁剪,我們認為機器人也需要10張英偉達A100,未來的話我們相信機器人的數量會超過人類,因為它可以解放你的生產力。

假如100億的機器人,現在一張英偉達A100的卡基本上都在十多萬,可以看到形成了多么大的空間。當然這是比較遠期的假設,可能需要十年左右的時間,但也讓我們感受到算力擴張的量級,因為算力嚴格意義上是跟著應用走的,所以算力是一個比較確定的方向。

需求上也是比較確定的,方向上可能我們國家的企業更多的是解決供給的問題,如何設計出高密度的計算芯片。如何比較好地保證在晶圓代工這一塊供應鏈的穩定性,可能是整個產業需要重視的地方。

大模型端,國內的大模型逐漸多了起來,但是我們也看到,大模型是驅動整個產業鏈啟動的發動機,到底誰能做出來其實現在不好講。如果在比較深的優勢的行業,做行業的大模型,就很多人講的“小模型”。其實不對,Transformer它就是大模型,對Fine Tune微調之后的行業大模型,通用智能更好的這種大模型不一定比你效果更好,或者說即使效果比較好,綜合的能耗可能消耗比你大,這樣的一些可能性也是存在的,所以一定會有自己的機會所在。

在應用的階段,我們現在看到不管是辦公的這種多模態,金融領域、醫療領域、教育領域,還是像智能助理這樣一些To C的應用,都在蓬勃發展。我們相信在未來的半年到三年內,我們的生活一定會發生巨變,巨變之下可能大家就會真正感受到時代的魅力以及巨大的投資機會。

5、國盛證券劉高暢:產業周期變化 行情生命力強

提問:最近市場有比較大的波動,到了這種分歧的時刻,后市該怎么看?

劉高暢:我們前期寫了一篇報告——《1999年互聯網行情的復盤》。淡化所有對投資的理解,對護城河、PE、PB等框架的各種認知,從產業周期來講,最可比的就是1999年互聯網新技術的顛覆,帶來了巨大的變化。短期內可能產品形態、商業模式都不是非常清晰,因為它在快速變化,大家都在攻城略地,去改變這個世界。

這一輪的影響力可能比1999年的互聯網更大,因為影響的并不是說我們計算機行業的400家公司,也不是A股的4000家公司,它影響的是我們每一個人的生活,每一個人的工作狀態,影響的是整個社會的形態。我們認為,如此顛覆性的技術,它的持續期、它的高度、它的生命力是非常強的。

復盤1999年,當時產業的行情演繹大概是1年9個月的時間,也有十幾倍的一些公司,漲幾倍的公司不勝枚舉。其實從春節之后到現在,整個ChatGPT的演繹也就兩個月的時間,考慮到現在社會節奏變快,信息傳遞加速,行情的持續性和高度可能會超過大家的想象。

前一段交易上的波動我們認為問題不大,而且持續的時間也不會太長。我個人判斷時間可能不會特別長,下一輪的AI行情會開啟新一輪的機會,所以近期基于交易的回調是非常好的。

我們從2月份的路演開始一直講一件事,就是年內ChatGPT有且只有兩個利空,一個是大家意識到芯片這一塊有封鎖的風險,另外一個就是大家認識到我們國家的大模型和OpenAI有比較大的差距。但這兩件事情在2月底和3月中已經發生了,所以博弈已經完成了。純交易性的因素造成的調整,我們覺得每次回調都是非常好的布局機會,上一波重視程度不高的投資者,可以在新一輪的大行情中加大重視。

關鍵詞:

相關閱讀