Articles

  • 2 months ago | technews.tw | Alan K. Chen

    美國陸軍從二次大戰期間晉升為全球陸上強權,強大的工業生產能力讓美製戰車八十年來在全球各大洲戰場幾乎無役不與,隨著科技發展飛速,從 M1917、雪曼、巴頓到艾布蘭,美軍戰車的設計概念也隨之變化。 一次大戰期間緩慢殘酷的壕溝戰讓參戰各方蒙受慘重傷亡,直到英軍推出首款現代戰車馬克一號(Mark I)重型戰車,才打破了前線膠著的戰況,美軍在 1917 年加入協約國後,首度參與生產的戰車,是與英國合作的改良版馬克八號(Mark VIII)。 除了馬克八號重型戰車外,美軍也採用法國生產的雷諾 FT 為基礎,開發重量 7.25 公噸的 M1917 輕戰車,到一戰結束前約生產了 950 輛,成為美國史上首款量產的戰車型號。 二次大戰期間美國陸軍的裝甲主力,是配備 75 公厘主砲,重量 30 公噸的 M4 雪曼(Sherman)中型戰車,也是美國史上產量最多的一款,從 1942 年服役以來共生產超過 49,000 多輛。...

  • 2 months ago | technews.tw | Alan K. Chen

    在 Deepseek 掀起全球科技圈一陣波瀾後,各界都試圖從深度求索公布的文件中,找出他們如何成功的方式,南韓大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。 OpenAI 的 ChatGPT 引爆全球人工智慧熱潮,除了 Nvidia 顯示晶片的算力效能之外,CUDA 架構也是重要腳色之一,因此目前美國各大科技巨頭開發的 AI 產品,大多是以 CUDA 架構為基礎進行開發。 但是在 Deepseek 橫空出世後,號稱使用效能較低的 H800 晶片卻能產出與 ChatGPT 相等效能,使各界對於深度求索如何辦到感到好奇,南韓大宇未來資產在研究該公司文件後指出,Deepseek 並未像其他 AI 模型一樣採用 CUDA 架構,而是透過併行線程執行代碼(Parallel Thread Excution, PTX)構成。 PTX 是 Nvidia 為 GPU 產品開發的一種中間語言(Intermediate Language),是 CUDA 這類高階 GPU...

  • 2 months ago | infosecu.technews.tw | Alan K. Chen

    深度求索在發布新版開源 AI 模型 Deepseek-R1 和 V3 之後,掀起矽谷和華爾街一陣風暴,《彭博社》指出,身為 AI 技術領先的微軟和 OpenAI,目前正調查一間和 Deepseek 有關的公司,是否涉嫌非法將資料轉移給這家中國新創公司。 週一 Deepseek 發表了新版 AI 模型後,導致華爾街股市大地震,美國矽谷與 AI 有關的科技巨頭,包括微軟、OpenAI、Meta、Amazon 和 Alphabet 等,股市總值在一天之內蒸發了將近一兆美元。 Deepseek 號稱使用較低規的晶片,透過新型演算法讓新版 AI 模型具備與 ChatGPT 同等表現,而成本低了 98%,這讓微軟開始質疑是否有中間人非法將屬於 OpenAI 的資料轉移到深度求索。 《彭博社》透過微軟內部匿名消息來源報導指出,該公司的安全研究團隊,已經開始和 OpenAI 合作調查過往可疑的個人、團體和企業,試圖透過 OpenAI 的 API 將該公司的資料提給 Deepseek 進行提煉,讓 Deepseek 能夠用最快速度完成訓練。 美國白宮總統科技顧問委員會主席薩克斯(David...

  • 2 months ago | finance.technews.tw | Alan K. Chen

    在上篇專訪中,深度求索創辦人梁文鋒在接受《暗湧》專訪時,分享了他對中國和美國 AI 發展的看法,而在本篇他則分享了許多關於公司人才晉用和組織運作的風格。 暗湧:OpenAI 前政策主管、Anthropic 聯合創始人 Jack Clark 認為 DeepSeek 僱用了「一批高深莫測的奇才】,做出 DeepSeek-V2 的是怎樣一群人? 梁文鋒:並沒有什麼高深莫測的奇才,都是一些 Top 高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人。 暗湧:很多大模型公司都執著地去海外挖人,很多人覺得這個領域前 50 名的頂尖人才可能都不在中國的公司,你們的人都來自哪裡? 梁文鋒:V2 模型沒有海外回來的人,都是本土的。前 50 位頂尖人才可能不在中國,但也許我們能自己打造這樣的人。 暗湧:這次 MLA 創新是如何發生的?聽說 idea 最早來自一個年輕研究員的個人興趣? 梁文鋒:在總結出 Attention 架構的一些主流變遷法則後,他突發奇想去設計一個替代方案,不過從想法到落地,中間是漫長的過程。我們為此組了一個 team,花了幾個月時間才跑通。...

  • 2 months ago | finance.technews.tw | Alan K. Chen

    近日矽谷和華爾街出現翻天覆地的變動,只因來自中國深度探索公司公開的 Deepseek-V3 和 Deepseek-R1 兩款開源式 AI 模型,僅用六分之一成本達成了與 ChatGPT 比擬的效能,而該公司創辦人梁文鋒作風低調,但從最近一次接受《暗湧》的專訪中,可看見他對 AI 開發的企圖心。 梁文鋒行事作風低調,也很少接受媒體專訪,最近一次的《暗湧》訪問已經是 2024 年 7 月 18 日,當時深度求索剛公開 Deepseek-V2 模型,引起科技圈震撼而聲名大噪。 暗湧:DeepSeek V2模型發布後,迅速引發一場血雨腥風的大模型價格戰,有人說你們是業界的一條鯰魚。 梁文鋒:我們不是故意要成為一條鯰魚,只是不小心成了一條鯰魚。 暗湧:這個結果讓你們意外嗎? 梁文鋒:非常意外。沒想到價格讓大家這麼敏感。我們只是按照自己的步調來做事,然後計算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。 暗湧:5 天後智譜 AI 就跟進了,之後是字節、阿里、百度、騰訊等大廠。 梁文鋒:智譜 AI...

Contact details

Socials & Sites

Try JournoFinder For Free

Search and contact over 1M+ journalist profiles, browse 100M+ articles, and unlock powerful PR tools.

Start Your 7-Day Free Trial →