中国信通院开动“果真AI”AI Safety Benchmark大模子幻觉评测
东说念主民财讯3月19日电,据中国信通院音讯,为摸清大模子的幻觉近况,鼓动大模子诈欺走深走实,中国信息通讯推敲院东说念主工智能所基于前期的AI Safety Benchmark测评职责,现货投资发起大模子幻觉测试。本轮幻觉测试职责将以大谈话模子为测试对象,涵盖了事实性幻觉和诚挚性幻觉两种幻觉类型。测试数据包含7000余条华文测试样本,测试神情包括对应于诚挚性幻觉检测的信息抽取与常识推理两类题型,以及对应事实性幻觉检测的事实判别题型。总体波及东说念主文科学、社会科学、当然科学、诈欺科学和神情科学五种测试维度。