Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。▲Llama 3与Gemma、Mistral、Gemini、Claude 3的模型性能对比表Llama 3 70B也在MMLU、HumanEval、GSM-8K等基准上超越了闭源的谷歌Gemini Pro 1.5、Claude 3 So还有呢?
8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过Gemma 7B和Mistral 7B Instruct。而70B模型则超越了闭源的当红炸子鸡Claude 3 Sonnet,和谷歌的Gemini Pro 1.5打得有来有回。Huggingface链接一出,开源社区再次沸腾。眼尖的盲生们还第一时间发现了华点:Meta更藏了一手还有呢?
+^+
╯▽╰
8 B mo xing zai M M L U 、 G P Q A 、 H u m a n E v a l deng duo xiang ji zhun shang jun sheng guo G e m m a 7 B he M i s t r a l 7 B I n s t r u c t 。 er 7 0 B mo xing ze chao yue le bi yuan de dang hong zha zi ji C l a u d e 3 S o n n e t , he gu ge de G e m i n i P r o 1 . 5 da de you lai you hui 。 H u g g i n g f a c e lian jie yi chu , kai yuan she qu zai ci fei teng 。 yan jian de mang sheng men hai di yi shi jian fa xian le hua dian : M e t a geng zang le yi shou hai you ne ?
近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。模型根据体量大小分为Gemini Ultra、Gemini Pro、以及Gemini Nano三个版本,支持在云后面会介绍。
ゃōゃ
中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。模型根据体量大小分为Gemini Ultra、Gemini Pro、以及Gemini Nano说完了。
≥△≤
首次在MMLU测评上超过人类专家,在32个多模态基准中取得30个SOTA,可同时识别理解文本、图像、音频、视频和代码五种信息,几乎全方位超越GPT-4。Gemini有三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro,以及适用于端侧设备的Gemini Na后面会介绍。
Gemini首次在MMLU(大规模多任务语言理解)测评上超过人类专家,在32个多模态基准中取得30个SOTA(当前最优效果),几乎全方位超越GPT-4。本次发布包含三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano。其中说完了。
发表评论