DeepSeek-R1“爆火”后,多個(gè)云平臺(tái)宣布上線DeepSeek旗下模型。
北京時(shí)間2月4日凌晨,中國常駐聯(lián)合國代表傅聰在紐約聯(lián)合國總部舉行記者會(huì),介紹中國本月輪值安理會(huì)主席期間的主要議程設(shè)置。當(dāng)被問到中國人工智能企業(yè)深度求索(DeepSeek)發(fā)布的模型以及中美人工智能合作問題時(shí),傅聰強(qiáng)調(diào),“永遠(yuǎn)不要低估中國科研人員的聰明才智。DeepSeek引發(fā)全球轟動(dòng)和一些人的焦慮恐慌,說明技術(shù)遏制和技術(shù)限制無法奏效,這是全世界、特別是美國需要學(xué)習(xí)的一課”。
DeepSeek絕對(duì)是目前最火的應(yīng)用,日常寫作、翻譯、問答都能輕松搞定,獨(dú)特的深度思考模式加上聯(lián)網(wǎng)搜索,在編程、解題、文獻(xiàn)解讀等復(fù)雜任務(wù)中也游刃有余,推理思考能力一絕。

01
DeepSeek是什么?
如果你對(duì)AI有一定的認(rèn)知,日常已經(jīng)在使用Kimi、豆包等產(chǎn)品的話,那你就可以類比來理解DeepSeek。DeepSeek中文翻譯叫做深度求索。
深度求索是這家公司的名稱:杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù)。
在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網(wǎng)上熱議的“杭州六小龍”之一。
2024年底,DeepSeek發(fā)布了新一代大語言模型V3,同時(shí)宣布開源。測(cè)試結(jié)果顯示,它的多項(xiàng)評(píng)測(cè)成績(jī)超越了一些主流開源模型,并且還具有成本優(yōu)勢(shì)。

隨后,在本月世界經(jīng)濟(jì)論壇2025年年會(huì)開幕當(dāng)天,中國深度求索公司發(fā)布其最新開源模型R1,再次引發(fā)全球人工智能領(lǐng)域關(guān)注。據(jù)該公司介紹,R1模型在技術(shù)上實(shí)現(xiàn)了重要突破——用純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,該模型同時(shí)延續(xù)了該公司高性價(jià)比的優(yōu)勢(shì)。
據(jù)了解,深度求索公司R1模型訓(xùn)練成本僅為560萬美元,遠(yuǎn)遠(yuǎn)低于美國開放人工智能研究中心、谷歌、“元”公司等美國科技巨頭在人工智能技術(shù)上投入的數(shù)億美元乃至數(shù)十億美元。
02
DeepSeek的下載途徑
【網(wǎng)頁版】
你可以直接訪問DeepSeek的官方網(wǎng)站(https://chat.deepseek.com),使用微信或手機(jī)號(hào)注冊(cè)。
點(diǎn)擊開啟深度思考 R1,在網(wǎng)頁上輸入你的問題或指令,DeepSeek會(huì)即時(shí)給出回答。

【APP版】
DeepSeek的APP已經(jīng)上線,支持iOS和安卓系統(tǒng)。在手機(jī)應(yīng)用商店中搜索“DeepSeek”,下載安裝后就可以隨時(shí)隨地使用了。
APP功能強(qiáng)大,支持對(duì)話、語言翻譯、創(chuàng)意寫作、編程輔助等多種功能。

03
DeepSeek的功能特點(diǎn)
(一)文本生成
Deepseek 能根據(jù)給定提示或上下文信息,生成連貫、有邏輯的文本內(nèi)容,可用于撰寫文章、故事、詩歌、代碼注釋等,能大大提高創(chuàng)作效率。
(二)問答系統(tǒng)
作為強(qiáng)大的問答系統(tǒng),Deepseek 能準(zhǔn)確回答各種問題,無論是常識(shí)性問題還是專業(yè)領(lǐng)域問題,都能依據(jù)知識(shí)和語義理解能力給出準(zhǔn)確詳細(xì)的答案,可應(yīng)用于智能客服、知識(shí)圖譜查詢等場(chǎng)景。
(三)文本分類
Deepseek 能對(duì)輸入文本進(jìn)行分類,如對(duì)新聞文章分類、對(duì)用戶評(píng)論進(jìn)行情感分析等,在信息檢索、輿情監(jiān)測(cè)、客戶反饋分析等領(lǐng)域應(yīng)用廣泛。
(四)機(jī)器翻譯
Deepseek 具備機(jī)器翻譯功能,能實(shí)現(xiàn)多種語言之間的自動(dòng)翻譯,保持原文語義和風(fēng)格,為跨語言交流和國際合作提供便利。
(五)對(duì)話交互
Deepseek 支持自然流暢的對(duì)話交互,能與用戶進(jìn)行多輪對(duì)話,理解用戶意圖并做出合適回應(yīng),可應(yīng)用于智能聊天機(jī)器人、虛擬助手等場(chǎng)景。
04
DeepSeek的使用技巧
相比gpt不需要多專業(yè)的提示詞技巧,和deepseek說人話就可以。
今天教大家一個(gè)簡(jiǎn)單四步提問法,讓DeepSeek變身你的“職場(chǎng)軍師”和“流量引擎”!

需要注意的是,以下這些坑千萬別踩。
(一)隱私安全要注意
別上傳身份證、銀行卡照片;
公司機(jī)密文件記得打碼再上傳;
(二)結(jié)果要核對(duì)
重要數(shù)據(jù)自己再算一遍;
法律文件建議找專業(yè)人士復(fù)核;
(三)使用要合理
別讓AI代寫畢業(yè)論文(查重過不了);
每天對(duì)話別超100條,小心系統(tǒng)卡殼。

使用DeepSeek必備的10個(gè)技巧
(一)巧用DS的三種模式

DeepSeek的網(wǎng)頁版和APP版,都十分簡(jiǎn)潔,只有一個(gè)聊天窗口,以至于其APP只有8M大小。
聊天界面提供了三種模式——基礎(chǔ)模型、深度思考(R1)和聯(lián)網(wǎng)搜索,可根據(jù)不同場(chǎng)景和需求,靈活選用。

基礎(chǔ)模型,于去年12月升級(jí)到DeepSeek-V3版,性能比肩全球頂尖的開閉源模型(如4o、Claude-3.5-Sonnet、Qwen2.5、Llama-3.1等)。
不勾選任何功能,即默認(rèn)使用V3基礎(chǔ)模型。大多數(shù)情況下,選擇基礎(chǔ)模型就完全夠用了。
深度思考(R1),是今年1月新發(fā)的DeepSeek-R1正式版,效果完全不輸OpenAI o1(只有尊貴的Pro用戶才能使用,200美刀/月),因免費(fèi)+開源+極低價(jià)API,讓DS在這個(gè)春節(jié)成為“國運(yùn)”級(jí)模型,爆火海內(nèi)外。
R1是一個(gè)愛思考的深度推理模型,主要擅長處理數(shù)理邏輯、代碼和需要深度推理的復(fù)雜問題。通常,一些寫詩、寫文章的需求,用不到這個(gè)模型。
聯(lián)網(wǎng)搜索,是讓DS根據(jù)網(wǎng)絡(luò)搜索結(jié)果來回答問題,也就是RAG(檢索增強(qiáng)生成),你可以把它理解為DeepSeek的AI搜索功能。
(二)R1對(duì)標(biāo)o1,V3對(duì)標(biāo)4o
不打開深度思考,啟用的是V3模型,這是DeepSeek的基礎(chǔ)模型,采用Moe架構(gòu),671B參數(shù),與GPT-4o、Claude-3.5-Sonnet類似。擅長答百科知識(shí),回答速度超級(jí)快。

打開深度思考,啟用的則是R1模型,是類似o1、o3的推理模型,660B參數(shù),采用的是后訓(xùn)練+RL強(qiáng)化學(xué)習(xí),擅長邏輯推理、復(fù)雜問題解答,回答速度較慢。
關(guān)于4o與o1的區(qū)別,一張表說明:如何選用V3和R1模型。

至于聯(lián)網(wǎng)功能,通常不用同時(shí)勾選深度思考和聯(lián)網(wǎng)搜索,不然DS的表現(xiàn)會(huì)不太智能。
(三)知識(shí)更新至2024年7月
DeepSeek的預(yù)訓(xùn)練數(shù)據(jù),更新至2024年7月。

所以,2024年7月前的問題基本上不需要打開聯(lián)網(wǎng)功能。而之后的問題DS未學(xué)習(xí),建議開啟聯(lián)網(wǎng)功能,效果更佳。
(四)提示詞核心:準(zhǔn)確表達(dá)
DeepSeek,無論是V3還是R1模型,都是不太吃提示詞的,只需要做到【準(zhǔn)確表達(dá)】即可。
通用提示詞模板=你是誰+你的目標(biāo)。
br
適當(dāng)情況下,還可以補(bǔ)充一些背景信息:
你是誰+背景信息+你的目標(biāo)。
br
也可以是:
我要xx,做xx用,希望達(dá)到xx效果,但擔(dān)心xx問題……
br
不管哪個(gè)模板,其核心都是準(zhǔn)確表達(dá)。做到準(zhǔn)確表達(dá),基本就夠用了。過去學(xué)的那些結(jié)構(gòu)化提示詞,可直接丟掉。
(五)與DS溝通,盡量說人話
與DS溝通,盡量說人話。
越是直白、俗氣,就越能激發(fā)它的潛能。
模仿風(fēng)格,你只需要告訴它,模仿誰?寫什么?就夠了。
(六)我是一名小學(xué)生
過去,我們經(jīng)常吐槽AI生成的東西一股子AI味。
其原因是模型輸出太注重結(jié)構(gòu)化,一堆“首先、其次、然后、總而言之”之類的連詞,導(dǎo)致內(nèi)容太死板。
人類這個(gè)感性的動(dòng)物,最是討厭這些理性的東西,特別是文字領(lǐng)域,八股文、學(xué)術(shù)文讀起來常常讓人昏昏欲睡。
這種情況,建議你加一句提示:
我是一名小學(xué)生 / 請(qǐng)用小學(xué)生能聽懂的話解釋。
br
這句提示用在DS里,特別好使,如果進(jìn)入博士領(lǐng)域,就開始上難度了。
(七)活用聯(lián)網(wǎng)搜索
以o1為代表的推理模型,基本上都是不能聯(lián)網(wǎng)的。
如果想了解知識(shí)庫截止日期后的問題,DeepSeek支持推理+聯(lián)網(wǎng)的模型。
(八)活用上傳附件
DS的推理模型,不僅能聯(lián)網(wǎng),還支持上傳附件(最多不超過50個(gè),每個(gè)不超過100MB)。
推理+上傳附件,可以做更多本地化、私密化的東西,比如你自己的知識(shí)庫或者內(nèi)部資料。讓其基于自有知識(shí)庫進(jìn)行推理和思考。
(九)活用V3+R1
前面提到,V3是基礎(chǔ)模型,它專注于告訴我們要什么。而R1是推理模型,專注于告訴我們?nèi)绾嗡伎肌⑼评怼?/p>
那為什么不能將2個(gè)模型結(jié)合起來使用呢?比如,先跟V3多輪對(duì)話,得到要推理的細(xì)節(jié)和提示詞,然后發(fā)給R1,讓R1再來推理、輸出。這樣,就能將DS的能力又提升一個(gè)等級(jí)。
(十)R1的3個(gè)開放
對(duì)于R1模型,DeepSeek做到了3個(gè)開放:
1)思維鏈全開放。無論是應(yīng)用端還是API,都可以看到完整、透明的思考過程。API,通過設(shè)置 `model='deepseek-reasoner'` ,即可調(diào)用。
2)訓(xùn)練技術(shù)全部公開。DeepSeek在后訓(xùn)練階段大規(guī)模使用了RL強(qiáng)化學(xué)習(xí)技術(shù),通過極少標(biāo)注數(shù)據(jù),極大提升模型推理能力。所有訓(xùn)練技術(shù)全部公開,目前全球多個(gè)研究機(jī)構(gòu)均已復(fù)現(xiàn)R1。
3)開源2+6個(gè)模型。R1預(yù)覽版和正式版的參數(shù)高達(dá)660B,非一般公司能用。為進(jìn)一步平權(quán),于是他們就蒸餾出了6個(gè)小模型,并開源給社區(qū)。最小的為1.5B參數(shù),10G顯存可跑。
最后,用DeepSeek-R1模型的一個(gè)問題作為結(jié)尾:
“在技術(shù)加速超越人類能力的時(shí)代,你們將如何重新定義自身的價(jià)值與目的,以確保進(jìn)步的方向始終服務(wù)于生命的整體繁榮,而非分裂與異化?”

那么,你的答案會(huì)是什么?
熱門跟貼