未来金融科技领域将深刻体现Agent的价值,即一个智能代理能根据用户需求进行意图识别和决策。本次大赛融合了数据查询与文本理解两大任务,充分体现了Agent核心思想:根据不确定输入,判断用户意图,并调用相应服务或功能生成答案。
选手需以通义千问金融大模型或通义千问7B模型(不限制pretrain和chat)作为基础大模型,可以结合多个模型,共同创建一个问答系统。可以采用Prompt Engineering方法,也可以使用外部数据对模型进行微调。
任务目标: 使用通义千问金融大模型或通义千问7B模型,根据用户的问题进行高准确率的查询。
技术难题: 处理多表之间的复杂关联,如理解基金股票持仓明细与A股日行情表的连接,并确保查询的高准确性。
大小:1.46g; 文件格式:sqllite db文件; 文件数量:1; 时间跨度:2019年-2021年
数据表包括:基金基本信息、基金股票持仓明细、基金债券持仓明细、基金可转债持仓明细、基金日行情表、A股票日行情表、港股票日行情表、A股公司行业划分表、基金规模变动表、基金份额持有人结构
任务目标: 对长文本进行细致检索与解读,高效提取关键信息。
技术难题: 处理长文本的复杂结构,确保信息完整性。对超长文本,选手需合理分块,并从文档分块中准确提炼答案。
pdf源文件大小 | 527MB |
---|---|
文件格式 | pdf文件 |
文件数量 | 80 |
招股说明书pdf源文件大小:527MB;文件格式:pdf文件;文件数量:80;招股说明书 pdf解析后的txt文件
大小:44MB
文件格式:txt文件
文件数量:80
— Dec 10, 2023
Made with ❤ and at Earth.