神经网络

【代码】蒙特卡罗算法求解TSP

作者 : 老饼 发表日期 : 2023-05-30 02:22:40 更新日期 : 2023-11-20 18:14:17
本站原创文章,转载请说明来自《老饼讲解-BP神经网络》www.bbbdata.com



TSP问题是优化问题中的经典问题,

本文分析如何应用蒙特卡罗算法求解TSP问题,并展示算法求解效果

通过本文,可以进一步感受蒙特卡罗算法的强大之处




    01. 蒙特卡罗算法求解TSP    



本节回顾TSP问题及分析蒙特卡罗算法求解TSP问题的思路



     TSP旅行商问题回顾      


TSP旅行商问题如下:
有N个城市 ,要求穿过每个城市,最终回到出发城市,
问:寻找一条路径,使旅行总距离最小
该问题无法穷举,因为如果有20个城市,则可选组合为19!种



     蒙特卡罗算法求解TSP-算法思路     


对于TSP问题,我们可以使用逐个城市决策的方式
即先确定起始城市,然后每次选择期望最优的城市作为下个城市,直到走完所有城市
 详细如下:
先初始化出发城市,这里不妨将出发城市初始化为城市A,
 由于路径最终是闭环的,所以选择哪个城市作为出发城市都是一样的
然后评估哪个城市能使最终总路径最小,就选择哪个城市作为下个城市
 
由于还没有确定剩下所有城市的路径,此时没法计算出最终的总路径,
但我们可以用蒙特卡罗法去评估总路径期望,
 也即假设选择第j个城市作为下一个城市时,
将剩余城市随机走m次,用这m次的平均总路径作为选择城市j的最终总路径评估

如此反复,直到走完所有城市



     蒙特卡罗算法求解TSP - 算法流程     


一、初始化选择一个出发城市                                                   
二、评估各个城市作为下个城市的代价:                                   
评估城市k的代价的方法:
以城市k作为下个城市,再随机走完剩余城市,走m次
1.如果城市较多时,把m次的平均路程作为城市k的代价
2.如果城市较少时,把m次中最短路程作为城市k的代价
三、选择代价最小的城市作为下个城市                                   
重复二、三,直到走完所有城市   






    02. 蒙特卡罗算法求解TSP-代码实现    



本节提供蒙特卡罗算法求解TSP的代码实现和展示求解结果



     蒙特卡罗算法求解TSP-代码实现     


在matlab中实现蒙特卡罗法求解TSP问题如下:
%------代码说明:展示蒙特卡罗法求解TSP问题 -----------------
% 来自《老饼讲解神经网络》www.bbbdata.com ,matlab版本:2018a 
function MC_TSP()
clc;clear all;close all
rng(999)
global distMat;
cityLoc = [3.64,2.68  ;...  %beijing
    4.18,1.76  ;...  %shanghai
    3.71,2.60  ;...  %tianjin
    1.33,3.30  ;...  %wulumuqi
    4.20,2.96  ;...  %shenyang
    3.92,1.82  ;...  %nanjing
    2.55,1.64  ;...  %chengdu
    2.37,1.02  ;...  %kunming
    3.43,2.09  ;...  %zhengzhou
    3.54,0.70  ;...  %xianggang
    3.51,1.62  ;...  %wuhan
    3.44,0.80  ;...  %guangzhou
    3.24,2.77  ;...  %huhehaote
    2.38,2.32  ;...  %xiling
    2.56,2.24  ;...  %lanzhou
    3.01,2.03  ;...  %xian
    2.79,2.51  ;...  %yinchuan
    4.03,1.16  ;...  %fuzhou
    3.47,0.70  ;...  %aomen
    1.30,1.69] ;     %lasha
distMat = dist(cityLoc') ;                                                % 计算城市距离
N       = size(cityLoc,1);                                                % 城市个数
%---------------主流程------------------------------------------
select_city   = 1;                                                        % 初始化起点城市
res_city      = 2:N;                                                      % 未走的城市(rest_city)
base_test_num = 200;                                                      % 尝试的次数

%-------逐个确定下一个城市------------------
for i=2:N
    res_n      = length(res_city);                                        % 可选城市个数
    res_city_F = zeros(res_n,1);                                          % 初始化各个可选城市的代价(若选该城市为下个城市,走完全程的代价)
    test_num   = res_n*base_test_num;                                     % 本次抽样的次数
    %-------计算选择各个城市的代价---------------------
    for j =1:res_n                                                        % 计算可选城市的代价
        select_city_tmp = [select_city,res_city(j)];                      % 添加第j个城市到路径中,作为临时路径
        rs_city_tmp     = res_city;                                       % 初始化临时剩余城市
        rs_city_tmp(j)  = [];                                             % 删掉本次选择的城市   
        % 通过抽样来评估选择了第j个城市后,最终的路径代价
        for k = 1:test_num                                                % 假设选择该城市,之后的路线用test_num次随机选择,综合多次采样结果作为选该城市的代价
            rand_idx     = randperm(length(rs_city_tmp));                 % 随机选择剩余的城市
            cur_x        =  [select_city_tmp,rs_city_tmp(rand_idx)];      % 本次的完整城市路径
            if (res_n>10)                                                 % 如果剩余城市较多时
                res_city_F(j) = res_city_F(j) + calF(cur_x)/test_num;     % 用平均值估值
            else                                                          % 如果剩余城市较少,就用抽样中最佳的路径来评估
                if(k==1)                                                  % 如果第一次抽样
                    res_city_F(j)= calF(cur_x);                           % 初始化最佳路径距离 
                else                                                      % 否则
                    res_city_F(j) = min(res_city_F(j),calF(cur_x));       % 更新最佳路径距离
                end
            end
        end
    end
    %---------选择代价最小的城市作为下个城市------------------------
    [~,select_idx] = min(res_city_F);                                     % 找出哪个城市的代价最低
    best_city      = res_city(select_idx);                                % 选择代价最低的城市作为下个城市
    select_city    = [select_city,best_city];                             % 更新已走城市
    res_city(select_idx) = [];                                            % 将本次选择的城市移出剩余城市
    
    %----------画图-------------------------------
    hold off
    plot(cityLoc(:,1),cityLoc(:,2),'o','MarkerEdgeColor','k','MarkerFaceColor','y','MarkerSize',10,'LineWidth',2)
    hold on
    plot(cityLoc(select_city,1),cityLoc(select_city,2),'LineWidth',2)
drawnow
end
%-----------打印结果---------------------------------------
F = calF(select_city);                                                    % 计算最终的路径所需要代价
disp(['城市路径:',num2str(select_city)])                                  % 打印城市路径
disp(['路径需所距离:',num2str(F)])                                        % 打印路径所需要的的距离

end

%------------目标函数值计算方法------------------------
function d= calF(x)
global distMat;
d = distMat(x(end),x(1));                                                 % 初始化总距离
for i=1:length(x)-1
    d = d + distMat(x(i),x(i+1));                                         % 累加各个城市之间的距离
end
end



    运行结果    


程序运行结果如下:
  
  
可以看到,该方法已经成功地找出了较为合理的路径,说明算法是有效的





    编后语    


由于没有找到一个非常清晰的蒙特卡罗求解TSP的算法流程或代码
于是笔者就只能按蒙特卡罗的算法思想设计和编写了一下,作为学习者的参考和借鉴
蒙特卡罗是非常强大的思想,小小TSP随便拿捏










 End 






联系老饼