# 2024金融行业·大模型挑战赛 ## [官网地址]() 来源于由清华大学基础模型研究中心主办的《2024金融行业·大模型挑战赛》。400道涉及77张表、3000+字段、涵盖了58个二级市场各个领域(股权、交易、基金、财务、行业、港股、美股等)的类似题目。完全复刻了金融行业二级市场的真实需求。比赛历时4个月,设有初赛A/B轮、复赛A/B轮及决赛答辩多个阶段,吸引1337位选手、300余支队伍参与,最终44支队伍晋级复赛,13支队伍进入决赛,充分展现出金融智能化应用的创新潜力。 赛事支持: 智谱, 博时基金, 安硕信息, 恒生聚源, Gitee, 魔搭社区, ZLead硅谷委员会, Huggingface, WaytoAGI ## 我们的主题:让大模型像人一样思考 我们的答辩PPT:[ShallowRest浅寻止步_决赛答辩.pdf](https://github.com/ben1234560/AiLearning-Theory-Applying/blob/master/LLM%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%AB%9E%E8%B5%9B%E5%AE%9E%E6%88%98_%E4%BC%98%E8%83%9C%E8%A7%A3%E5%86%B3%E6%96%B9%E6%A1%88/2024%E9%87%91%E8%9E%8D%E8%A1%8C%E4%B8%9A%C2%B7%E5%A4%A7%E6%A8%A1%E5%9E%8B%E6%8C%91%E6%88%98%E8%B5%9B/ShallowRest_%E6%B5%85%E5%AF%BB%E6%AD%A2%E6%AD%A5.pdf) 亮点:自适应思维机制(自动快或者深思考)、自纠正分解决策树。 ## 项目目录结构 ``` code/ ├── config.py +++++++++++++++++++++++++++++++ 配置信息和数据读取 ├── main.py +++++++++++++++++++++++++++++++++ 运行主函数 ├── main_all.py +++++++++++++++++++++++++++++ 运行主函数备份(全部代码没拆的提交版) ├── Dockerfile ++++++++++++++++++++++++++++++ 用来构建docker镜像的文件 └── agent/ ├── __init__.py ├── brain.py ++++++++++++++++++++++++++++ 逻辑运行主代码 ├── llm_client.py +++++++++++++++++++++++++++ LLM调用代码 ├── optimization.py +++++++++++++++++++++ 获取及调整答案 ├── sql/ │ ├── __init__.py │ ├── exec.py +++++++++++++++++++++++++ 运行sql │ ├── process_sql.py ++++++++++++++++++ sql优化 │ └── knowledge.py ++++++++++++++++++++ sql提示词 ├── embeddings/ │ ├── __init__.py │ └── embedding_utils.py+++++++++++++++ 求相似度 ├── schema/ │ ├── __init__.py │ ├── schema_utils.py +++++++++++++++++ 策略代码,表的匹配等 └── question/ │ ├── __init__.py │ └── question_utils.py +++++++++++++++ 问题重写及获取背景板 └── utils/ │ ├── __init__.py │ └── async_util.py +++++++++++++++++++ 决策树代码 │ └── io_utils.py +++++++++++++++++++++ 读取数据函数 │ └── json_utils.py +++++++++++++++++++ json相关代码 │ └── text_utils.py +++++++++++++++++++ text相关代码 └── devlop_home/ │ ├── 2024-fic-lmc-data-0217/ +++++++++ 相关数据 │ ├── input_param.json ++++++++++++++++ 按赛方要求放的 │ ├── question.json +++++++++++++++++++ 问题(初赛A榜的,我用来测试) │ ├── requirements.txt ++++++++++++++++ 代码运行所需依赖 └── devlop_data/ ++++++++++++++++++++++++ 赛方线上运行时,放数据的地方 └── devlop_result/ ++++++++++++++++++++++ 运行后放结果的地方 ``` ## 运行环境 Python版本为3.10(3.9+兼容),各个Python包版本见requirements.txt,使用如下命令即可安装: ``` pip install -r code/devlop_home/requirements.txt ``` ## 构建镜像运行代码 ~~~ 1. 登录认证(可以不登录,比赛方的环境可能没有了): docker login hubdocker.aminer.cn 2. 基础镜像获取: docker pull hubdocker.aminer.cn/library/python-base:1.0.0 创建:docker build -t hubdocker.aminer.cn/00c5912021a54b938e4f22a10eeb96cb/shallowrest_submit:v_1 . 其中hubdocker.aminer.cn是比赛方给的,换成别的也可以 运行测试: docker run -d --name test_v_1 hubdocker.aminer.cn/00c5912021a54b938e4f22a10eeb96cb/shallowrest_submit:v_1 tail -f /dev/null docker exec -it test_v_1 /bin/bash 运行: cp /app/devlop_home/*.json /app/devlop_data/ /app/py_devlop.sh /app/devlop_data/input_param.json /app/devlop_result/answer.json head -n40 /app/devlop_result/answer.json ~~~ ## 一些额外的点 1. 举办方的支持很到位,是我打过这么多国内比赛中,响应最到位的了。(尤其是在新赛题的情况下) 2. 应该能走的很远,看钱够不够了。 **祝清竞越办越好🎉🎉🎉** ## 终榜季军(图还没给,但钱到账了,神速!)