AiLearning-Theory-Applying/LLM大模型竞赛实战_优胜解决方案/2024金融行业·大模型挑战赛/README.md

# 2024金融行业·大模型挑战赛


## [官网地址](<https://competitions.zhipuai.cn/matchDetail?id=120241202000000003>)

来源于由清华大学基础模型研究中心主办的《2024金融行业·大模型挑战赛》。400道涉及77张表、3000+字段、涵盖了58个二级市场各个领域（股权、交易、基金、财务、行业、港股、美股等）的类似题目。完全复刻了金融行业二级市场的真实需求。比赛历时4个月，设有初赛A/B轮、复赛A/B轮及决赛答辩多个阶段，吸引1337位选手、300余支队伍参与，最终44支队伍晋级复赛，13支队伍进入决赛，充分展现出金融智能化应用的创新潜力。

赛事支持： 智谱, 博时基金, 安硕信息, 恒生聚源, Gitee, 魔搭社区, ZLead硅谷委员会, Huggingface, WaytoAGI


## 我们的主题：让大模型像人一样思考

我们的答辩PPT：[ShallowRest浅寻止步_决赛答辩.pdf](https://github.com/ben1234560/AiLearning-Theory-Applying/blob/master/LLM%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%AB%9E%E8%B5%9B%E5%AE%9E%E6%88%98_%E4%BC%98%E8%83%9C%E8%A7%A3%E5%86%B3%E6%96%B9%E6%A1%88/2024%E9%87%91%E8%9E%8D%E8%A1%8C%E4%B8%9A%C2%B7%E5%A4%A7%E6%A8%A1%E5%9E%8B%E6%8C%91%E6%88%98%E8%B5%9B/ShallowRest_%E6%B5%85%E5%AF%BB%E6%AD%A2%E6%AD%A5.pdf)

亮点：自适应思维机制（自动快或者深思考）、自纠正分解决策树。


## 项目目录结构

```
code/
├── config.py +++++++++++++++++++++++++++++++ 配置信息和数据读取
├── main.py +++++++++++++++++++++++++++++++++ 运行主函数
├── main_all.py +++++++++++++++++++++++++++++ 运行主函数备份（全部代码没拆的提交版）
├── Dockerfile ++++++++++++++++++++++++++++++ 用来构建docker镜像的文件
└── agent/
    ├── __init__.py
    ├── brain.py ++++++++++++++++++++++++++++ 逻辑运行主代码
    ├── llm_client.py +++++++++++++++++++++++++++ LLM调用代码
    ├── optimization.py +++++++++++++++++++++ 获取及调整答案
    ├── sql/
    │   ├── __init__.py
    │   ├── exec.py +++++++++++++++++++++++++ 运行sql
    │   ├── process_sql.py ++++++++++++++++++ sql优化
    │   └── knowledge.py ++++++++++++++++++++ sql提示词
    ├── embeddings/
    │   ├── __init__.py
    │   └── embedding_utils.py+++++++++++++++ 求相似度
    ├── schema/
    │   ├── __init__.py
    │   ├── schema_utils.py +++++++++++++++++ 策略代码，表的匹配等
    └── question/
    │   ├── __init__.py
    │   └── question_utils.py +++++++++++++++ 问题重写及获取背景板
    └── utils/
    │   ├── __init__.py
    │   └── async_util.py +++++++++++++++++++ 决策树代码
    │   └── io_utils.py +++++++++++++++++++++ 读取数据函数
    │   └── json_utils.py +++++++++++++++++++ json相关代码
    │   └── text_utils.py +++++++++++++++++++ text相关代码
    └── devlop_home/
    │   ├── 2024-fic-lmc-data-0217/ +++++++++ 相关数据
    │   ├── input_param.json ++++++++++++++++ 按赛方要求放的
    │   ├── question.json +++++++++++++++++++ 问题（初赛A榜的，我用来测试）
    │   ├── requirements.txt ++++++++++++++++ 代码运行所需依赖
    └── devlop_data/ ++++++++++++++++++++++++ 赛方线上运行时，放数据的地方
    └── devlop_result/ ++++++++++++++++++++++ 运行后放结果的地方
```

## 运行环境

Python版本为3.10（3.9+兼容），各个Python包版本见requirements.txt，使用如下命令即可安装：

```
pip install -r code/devlop_home/requirements.txt
```


## 构建镜像运行代码

~~~
1. 登录认证（可以不登录，比赛方的环境可能没有了）：
docker login hubdocker.aminer.cn

2. 基础镜像获取：
docker pull hubdocker.aminer.cn/library/python-base:1.0.0

创建：docker build -t hubdocker.aminer.cn/00c5912021a54b938e4f22a10eeb96cb/shallowrest_submit:v_1 .
其中hubdocker.aminer.cn是比赛方给的，换成别的也可以
运行测试：
docker run -d --name test_v_1 hubdocker.aminer.cn/00c5912021a54b938e4f22a10eeb96cb/shallowrest_submit:v_1 tail -f /dev/null
docker exec -it test_v_1 /bin/bash

运行：
cp /app/devlop_home/*.json /app/devlop_data/
/app/py_devlop.sh /app/devlop_data/input_param.json /app/devlop_result/answer.json
head -n40 /app/devlop_result/answer.json
~~~


## 一些额外的点

1. 举办方的支持很到位，是我打过这么多国内比赛中，响应最到位的了。（尤其是在新赛题的情况下）
2. 应该能走的很远，看钱够不够了。

**祝清竞越办越好🎉🎉🎉**


## 终榜季军（图还没给，但钱到账了，神速！）