AI应用集
最新AI资讯
最新AI应用
AI知识库
提交AI工具
关于我们
AI写作工具
AI图像工具
AI视频工具
AI办公工具
AI聊天助手
AI智能体
AI编程工具
AI设计工具
AI音频工具
AI搜索引擎
AI开发平台
AI学习网站
AI训练模型
AI内容检测
AI模型测评
AI指令提示
AIBOT-HUB
帅气的我简直无法用语言描述!
文章
8
网址
656
软件
3
评论
0
已发布
656
PubMedQA
PubMedQA 是用于生物医学研究问答的数据集平台,拥有丰富的问答实例,提供模型排行榜,助力生物医学领域自然语言处理研究与模型评估。
10
0
AI模型测评
# PubMedQA
# 数据集
# 模型评估
H2O EvalGPT
H2O Eval Studio 是一款用于 GenAI 模型评估的平台,具备集成式执行仪表盘、模型与排行榜对比、可配置评估器等功能,能有效提升模型可靠性与准确性。
10
0
AI模型测评
# Eval
# GenAI
# H2O
LLMEval3
Chatbot Arena(原 LMSYS)是一个免费的 AI 聊天平台,用户可在此对比和测试各类最佳 AI 聊天机器人,通过与不同机器人互动,直观感受其性能差异。
13
0
AI模型测评
# ai
# Arena
# Chatbot
LMArena
Chatbot Arena(原 LMSYS)是一个免费的 AI 聊天平台,用户可在此对比和测试各类最佳 AI 聊天机器人,通过与不同机器人互动,直观感受其性能差异。
22
0
AI模型测评
# ai
# Arena
# Chatbot
HELM
HELM 是斯坦福大学开发的用于评估基础模型的全面框架,涵盖 142 个模型和 87 个场景,涉及问答、信息检索、总结、情感分析等多方面,提供全面准确的模型评估。
10
0
AI模型测评
# HELM
# 基础模型评估
# 多场景评估
MMBench
MMBench 是专注评估视觉语言模型能力的平台,有约 3000 道选择题,覆盖 20 多个细粒度评估维度。采用稳健评估方法和可靠输出提取方法,确保评估准确。由多机构团队贡献。
12
0
AI模型测评
# MMBench
# 多模态模型评估
# 视觉语言模型
CMMLU
CMMLU 是综合性中文评估基准,涵盖 67 个主题,评估语言模型中文知识与推理能力。含排行榜展示模型表现,提供数据集,适用于科研、开发等场景。
11
0
AI模型测评
# CMMLU
# 中文多任务语言理解评估
# 排行榜
OpenCompass
OpenCompass 司南的大语言模型评测榜单,为你呈现业内大语言模型的权威排名。展示多维度能力评测结果,含整体、语言、知识、推理等维度,助你精准了解模型实力。
14
0
AI模型测评
# OpenCompass
# 司南
# 大语言模型评测榜单
Glean – 企业级工作 AI 平台,让工作更高效
Glean 是一款为企业提供 AI 助力的工作平台,能让员工借助 AI 助手和智能代理将公司知识运用到工作中,提升工作效率,全球领先企业都在使用。
17
0
AI搜索引擎
# ai
# 企业
# 工作
XAnswer – 提供直接答案的免费 AI 搜索引擎
XAnswer 是免费的 AI 搜索引擎,能提供直接答案。可搜索体育赛事资讯,如橄榄球比赛赛况、NBA 比赛观看信息等。
12
0
AI搜索引擎
# ai
# 体育赛事资讯
# 免费搜索
Cusp AI – 前沿 AI 材料研发公司
Cusp AI 致力于解决推动人类进步所需的突破性材料难题,利用 AI 在数月内实现价值万亿美元的材料突破,拥有顶尖的领导团队和顾问阵容。
17
0
AI搜索引擎
# ai
# 材料研发
# 突破性材料
问问小宇宙 – 探索播客话题的新平台
问问小宇宙是一个可助力用户探索播客话题的平台,能让用户搜索京都旅行、历史类书籍推荐、理财话题、巴黎奥运会趣闻等各类感兴趣的内容。
12
0
AI搜索引擎
# 播客话题探索
# 话题搜索
加载更多
网址
网址
文章
软件