AI如何给传统算法“开挂”
2026-06-02
50

工业界和日常商业运转中,大厂们每天要面对无数个极其复杂的“选择题”:物流公司如何规划成百上千辆货车的行驶路线?电商仓库如何把不同体积的商品最省空间地装进纸箱?工厂的流水线应该如何排班才能让效率最高?
这些在现实中让人抓狂的调度问题,有一个统一的名字——混合整数规划(Mixed Integer Programming,简称 MIP)。这类问题折磨人的地方在于决策变量必须是整数。比如,你可以派出2辆货车或3辆货车,但绝对派不出“2.5辆货车”;你可以打包10个包裹,但不能打包“10.3个包裹”。这类问题在理论上被证明是 NP-hard 的,这意味着随着问题规模的扩大,计算量会呈指数级爆炸。
长期以来,人类科学家设计了各种精妙的启发式算法来求解这类问题,但它们高度依赖良好的人工初始解,且极其消耗算力。为了拯救这个“算力黑洞”,这篇论文提出:让机器学习(ML)化身军师,通过学习历史数据的规律来帮传统数学算法“抄近道”。了解 AI 如何介入之前,先看传统数学家是如何“死磕”混合整数线性规划(MILP)的。标准的 MILP 数学模型通常长这样:

解开这个模型最经典的算法叫分支定界法(Branch-and-Bound,简称 B&B)。核心思想是“分而治之”和“及时止损”。算法先不考虑整数限制(这叫线性规划松弛,LP Relaxation)得出一个好算的底线方案。如果算出来的变量不是整数(比如变量等于2.5),算法就会像画树状图一样,把问题无情地拆成两个分支:一边是“变量 ≤ 2”,另一边是“变量 ≥ 3”。

这是一个典型的分支定界树。顶端的根节点是不考虑整数限制的松弛问题,算出来的最优解包含小数。系统顺着箭头向下分叉(Branching),把可行域切成一个个小碎块。在搜索过程中,如果发现某个分叉的“最好可能性”(下界)比已经找到的某一个可行方案(上界)还要差,AI 或者算法就会果断把这个分叉给“切掉”(Prune/Fathomed),不再做无用功。最终,在第4个节点找到了完美的整数最优解。虽然分支定界法一定能找到完美答案,硬伤在于成千上万次的分叉决策,如果选错了一个变量进行分叉,整个搜索树的体积就会瞬间翻倍,让计算陷入泥潭。 既然人类科学家没办法摸透每一次分叉的规律,AI又是如何帮忙的?AI在这里扮演的是“领路人”的角色,在不破坏数学严谨性的前提下,教传统算法怎么走得更快:
智能变量挑选(BVS):在传统方法中,有一种叫“强分支(Strong Branching)”的规则挑选变量极准,但每一次挑选都要做一堆复杂的矩阵运算。用模仿学习(Imitation Learning),让神经网络学习强分支规则的决策结果,从而用极低的计算成本复制出大师级的变量挑选眼光。
将变量关系看作“社交网络”:AI 怎么看懂复杂的数学公式?论文介绍了一种方法-把 MIP 变成图神经网络(GCN)能读懂的二部图(Bipartite Graph)或三部图(Tripartite Graph)。


如图2所示,复杂的变量(Variables)和约束条件(Constraints)被分别放在了天平的两侧,错综复杂的系数连接变成了一条条边。图3进一步加入了目标函数(Objective)。通过这种转换,AI 就可以像分析社交网络里的“网红大 V”一样,揪出对全局影响最大的关键变量,优先对其进行分叉!

除了分叉,传统算法还擅长通过增加“割平面”(如图 4 所示的线性约束)来切掉不包含整数解的废弃区域,从而缩小搜索树。AI 利用强化学习(RL)在与环境的反复博弈中,能够高效挑选出最锋利、最能一刀切中要害的割平面。
在商业大促或紧急调度的真实场景中,大厂等不及传统算法花费几个小时去算一个完美答案。它们需要的是“在数秒钟之内给出一个能拿去用、且质量高”的及格方案。这类场景下,近似求解的启发式算法就成了主力军。
大邻域搜索(LNS):这种方法就像是在一片广阔的迷宫里找出口,先定一个初始位置,然后每次在周围一大片区域(邻域)里搜寻有没有更好的方案。但邻域太大会导致计算爆炸,太小又容易坐井观天。AI 通过强化学习,能够根据当前搜索的进度,自动、动态地调整“搜索探测器的半径大小”,甚至直接预测变量的初始值,带算法直接跳过大片迷宫。

可行性泵(Feasibility Pump):这是一种反复在“满足约束条件”和“满足整数要求”之间横跳、投影并相互拉近的算法(见图 5)。传统方法在横跳时容易陷入死循环,而“聪明版可行性泵(Smart FP)”引入了强化学习智能体,教算法在陷入僵局时如何做出扰动,快速跳出死循环,直奔可行解。
作者简介:严骏驰,上海交通大学人工智能学院教授(兼计算机科学与工程系),主要从事机器学习及其与组合优化、图学习、计算机视觉等方向的交叉研究。曾在 IBM Research(IBM研究院)任研究员/首席研究员多年,长期致力于将学习方法与组合优化、图匹配等问题相结合。
ORCID:0000-0001-9639-7679
DOI:10.1016/j.neucom.2022.11.024