🌑

Jenqyang

天池2023博金大模型挑战赛比赛心得

赛事介绍

未来金融科技领域将深刻体现Agent的价值,即一个智能代理能根据用户需求进行意图识别和决策。本次大赛融合了数据查询与文本理解两大任务,充分体现了Agent核心思想:根据不确定输入,判断用户意图,并调用相应服务或功能生成答案。

选手需以通义千问金融大模型通义千问7B模型(不限制pretrain和chat)作为基础大模型,可以结合多个模型,共同创建一个问答系统。可以采用Prompt Engineering方法,也可以使用外部数据对模型进行微调。

数据查询题挑战

任务目标: 使用通义千问金融大模型或通义千问7B模型,根据用户的问题进行高准确率的查询。

技术难题: 处理多表之间的复杂关联,如理解基金股票持仓明细与A股日行情表的连接,并确保查询的高准确性。

博金杯比赛数据.db
基金份额持有人结构表

大小:1.46g; 文件格式:sqllite db文件; 文件数量:1; 时间跨度:2019年-2021年

数据表包括:基金基本信息、基金股票持仓明细、基金债券持仓明细、基金可转债持仓明细、基金日行情表、A股票日行情表、港股票日行情表、A股公司行业划分表、基金规模变动表、基金份额持有人结构

文本理解题挑战

任务目标: 对长文本进行细致检索与解读,高效提取关键信息。

技术难题: 处理长文本的复杂结构,确保信息完整性。对超长文本,选手需合理分块,并从文档分块中准确提炼答案。

pdf源文件大小 527MB
文件格式 pdf文件
文件数量 80

招股说明书pdf源文件大小:527MB;文件格式:pdf文件;文件数量:80;招股说明书 pdf解析后的txt文件

大小:44MB
文件格式:txt文件
文件数量:80

— Dec 10, 2023

Made with ❤ and Hexo.js at Earth.