ChatGPT是什么
ChatGPT是由OpenAI公司推出的火爆全球的聊天對話機器人,該AI聊天對話工具建立在OpenAI開發(fā)的GPT-4語言模型上,它可以執(zhí)行各種自然語言處理(NLP)任務(wù),如總結(jié)、分類、提問和回答,以及類似人類反應(yīng)的錯誤糾正。ChatGPT是一項革命性的技術(shù),通過將人們的工作效率提高到一個新的水平,使人們的生活更加輕松。
ChatGPT由誰開發(fā)
ChatGPT人工智能聊天機器人是由OpenAI開發(fā)和擁有的,Elon Musk和Sam Altman在2015年將其作為一家非營利性公司創(chuàng)立。2018年,馬斯克從OpenAI中撤出,不再擁有OpenAI的股份。起初,該公司從硅谷風(fēng)險資本家那里獲得了10億美元,以啟動構(gòu)建神經(jīng)網(wǎng)絡(luò)。
2019年,OpenAI從微軟那里籌集了10億美元的第二輪資金。他們開始使用Azure超級計算機來構(gòu)建這些大型語言模型。快進到2023年,微軟向OpenAI投資了100億美元,使其總股份達到49%。其他投資者,包括Khosla Ventures,又占了49%,而OpenAI只保留了2%的股權(quán)。
ChatGPT是如何工作的
在ChatGPT之前,人工智能聊天機器人就已經(jīng)出現(xiàn)了,但由于它們不是對話式的,所以并未引起人們的普遍關(guān)注。而在2017年,谷歌在他們的論文《Attention is All You Need》中介紹了一個名為The Transformer的神經(jīng)網(wǎng)絡(luò)架構(gòu),這創(chuàng)造了一個訓(xùn)練大型語言模型(LLM)的范式轉(zhuǎn)變。
與其他神經(jīng)網(wǎng)絡(luò)相比,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長短期記憶網(wǎng)絡(luò)(LSTM)都比不上Transformer網(wǎng)絡(luò)。RNN在長期依賴性方面存在問題,而LSTM無法專注于長句中的正確單詞以獲得正確的輸出。
而Transformer網(wǎng)絡(luò)改變了語言模型的訓(xùn)練方式,Transformer不像RNN那樣一次處理一個詞,而是可以一次注入整個輸入。此外,Transformer允許平行運行多個輸入,減少計算成本,訓(xùn)練速度更快。
意識到Transformer的潛力后,OpenAI決定利用Transformer網(wǎng)絡(luò),并按照其架構(gòu)進行數(shù)據(jù)訓(xùn)練。這些模型的訓(xùn)練過程主要包括三個步驟:生成式預(yù)訓(xùn)練(Generative pre-training)、監(jiān)督微調(diào)(Supervised fine-tuning)、基于人類反饋的強化學(xué)習(xí)(RLHF)。
如何使用ChatGPT
ChatGPT有一個基礎(chǔ)版本,可以免費使用,要使用ChatGPT,你只需要訪問他們的官方網(wǎng)站(https://chat.openai.com/chat),無需下載,去ChatGPT頁面登錄即可,你可以選擇郵箱注冊或用你的谷歌或微軟賬戶登錄。
ChatGPT的網(wǎng)頁界面對所有用戶來說都很容易使用,顯示界面包括一個供用戶輸入查詢的文本框和一個顯示結(jié)果的區(qū)域。輸入你的文字提示后,然后你就會收到ChatGPT返回的回應(yīng)信息。