-
23 hours ago |
lemagit.fr | Yann Serra
TSMC en perte de motivation pour le sol américain TSMC, le numéro un mondial de la fabrication de semiconducteurs, devait quant à lui recevoir une subvention de 6,6 Mds $, plus un prêt de 5 Mds $, pour répliquer sur le sol américain ses usines taiwanaises. Son projet industriel consiste à investir 100 Mds $ de dollars dans des capacités industrielles sur le sol américain.
-
2 days ago |
lemagit.fr | Yann Serra
Concurrencer Nvidia dans les réseaux de calcul de l’IA L’expert ajoute qu’il suffira d’enchaîner un second switch sur chacun des ports du premier pour grimper, via une translation d’adresses, à 128 000 machines interconnectées dans le même réseau. Ce nombre n’est pas si astronomique : les plus puissants clusters de calcul de l’IA interconnectent déjà 100 000 GPU.
-
3 days ago |
lemagit.fr | Yann Serra
Exactement à la date prévue mais plus tout à fait au même prix. Comme il s’y était engagé en novembre 2024, l’État va donc nationaliser la division Advanced Computing d’Atos, mais en la rachetant 410 millions d’euros et plus « 500 à 625 millions d’euros » comme l’avait, à l’époque, annoncé le ministère de l’Économie.
-
4 days ago |
lemagit.fr | Yann Serra
Encore un nouveau type d’accélérateur pour l’intelligence artificielle. La startup EnCharge AI, fondée par des chercheurs de l’université américaine de Princeton, vient de dévoiler une puce EN100 qui fournirait une puissance de calcul de 200 TOPS (mille milliards d’opérations) à un ordinateur personnel. Soit sous la forme d’une barrette M.2 de 32 Go pour PC portables, soit sous celle d’une carte PCIe qui contient quatre EN100 et 128 Go de mémoire.
-
1 week ago |
lemagit.fr | Yann Serra
L’éditeur de systèmes de stockage DataCore rachète l’éditeur d’une appliance d’hyperconvergence StarWind. Sorte de Nutanix-bis, StarWind propose une pile système qui gère les machines virtuelles et virtualise le stockage par-dessus les hyperviseurs VMware ESXi, Microsoft Hyper-V ou encore sa propre version de KVM. Fondé en 2008 par un ancien ingénieur responsable du noyau Windows, StarWind revendique près de 64 000 clients dans le monde.
-
2 weeks ago |
lemagit.fr | Yann Serra
La difficile question de la sécurité « Attention au battage médiatique autour de l’IA qui, combiné à l’inexpérience des clients, crée de nouveaux risques en matière de sécurité », alerte pour sa part Maxim Balin, le responsable des produits Cybersécurité et AIOps de Dell Technology. Selon lui, ces risques existent d’autant plus quand une entreprise se lance seule dans les projets d’IA, ce qui est principalement le cas quand elle se contente de souscrire à des services d’IA en ligne.
-
2 weeks ago |
lemagit.fr | Yann Serra
Le stockage objet, un mode d’accès bien plus pratique pour l’IA L’accès rapide aux données de calcul est une problématique qui était historiquement résolue par l’utilisation de baies de stockage en mode fichiers, c’est-à-dire des NAS via les protocoles NFS ou SMB. Et pour cause, le mode fichier présente très peu de couches à décoder ; il faut juste lire un index qui indique sur quels blocs de quels disques se trouvent les données souhaitées. Cela implique donc intrinsèquement très peu de latence.
-
2 weeks ago |
lemagit.fr | Yann Serra
Des cas d’usage différents selon l’accélérateur Selon Dell, ces PC supporteraient d’utiliser des LLM jusqu’à 109 milliards de paramètres. Pour en faire tenir autant dans 64 Go, il s’agit nécessairement de paramètres stockés avec une résolution de 4 bits. Seul le GPU de Nvidia supporte de travailler dans ce mode. Les NPU de Qualcomm utilisent des tokens vectorisés sur 8 bits, la version en deux NPU avec 64 Go de RAM supporterait donc des LLM d’une cinquantaine de milliards de paramètres.
-
2 weeks ago |
lemagit.fr | Yann Serra
Assembler virtuellement différents clusters DGX Selon Nvidia, ce service permet soit de louer à la demande une puissance quelconque, soit de la réserver pour une durée indéterminée. Il est aussi possible de sélectionner les datacenters physiques d’où seront piochées les ressources, ce que le constructeur présente comme un effort de respect des besoins de souveraineté. A priori, tous les fournisseurs de cloud public hébergeant des clusters DGX sont susceptibles de rejoindre l’offre.
-
2 weeks ago |
techtarget.itmedia.co.jp | Yann Serra
検証の結果として、LLMが生成した文章の完成度は高く、一貫性、複数のテーマに沿った章立て、適切な引用の挿入、躍動感のある見出し、結びの文まで、体裁は整っていた。しかし、どのLLMによるアウトプットも、生成された記事をそのまま公開できる水準には至らなかった。 推論能力に定評のあるDeepSeek R1でさえ、取材中に提示された論点の優先順位を適切に判断できず、重要なポイントを見落としてしまう傾向があった。その結果、文章の体裁は整っていても、実質的な意味に乏しい記事が生成された。 LLMによって語彙(ごい)や文体にも大きな違いがあった。Llamaは可読性に課題があり、MistralとGemmaは抽象的でマーケティング的な表現が多く、具体性に欠ける内容が目立った。意外な発見としては、今回の検証で最も自然かつ美しいフランス語を生成したのが、中国のAlibabaが開発したQwenだったことだ。 初期段階で最も安定して高品質の出力を示したのは「Mixtral 8x7B」だった。Mixtralはタスクによって最適なモデルを使い分ける「スパース混合エキスパート」(MoE:Mixture of...