2019 MCM-C M 编程/建模手
技术栈:Py,R


这次美赛说实话只是临时起意,因为自己掌握了不少数据分析和可视化的知识。加上大一的时候没有参加,参加一次多一种体验。最后找队友也很随意,比我身边很多大一获得M奖的同学还要年轻,大二上+两大一上的组合,而且全是第一次参加,实在勇敢。如果不选择C题还好,至少原本的建模手还能有所斩获,但是由于最后我们选择了比较清晰的C题,大一新生又基本完全不懂数据分析,最后只能让我来兼职建模了。
我个人比较佛系,一般图书馆闭馆了就直接回去睡觉了,10点左右。最后一天论文都是其他两个队友在熬夜。不过最后早上,因为我对流程比较熟悉,所以把摘要基本重写了一遍。主要按照之前一篇O奖的思路把结构写的清晰了一些,还有一些意图只有我自己能表述。


Q1:
地理数据我是从Tableau上下载下来的,说实话找了挺久。
这道题我用的是Bass模型+场论。因为看到能使用人口数据的时候已经晚了,所以我只用了地理数据和毒品犯罪两个数据,这也使得建模很艰难。
Bass是因为我想找个有可解释性的模型,时间序列本身点太少又没可解释性,所以我只能选择拟合了。这个模型拟合的是新商品的传播,将人群划分成了因为好奇的创新和因为从众的模仿,然后我们还加入了由于政府导致的毒品犯罪减少,我感觉可解释性还行,就对整个州进行了拟合。但是这个拟合非常不准确(拟合很准,问题是这么多参数谁都能拟合出来),为后面的思路造成了隐患。
场论是因为题目需要我们找出毒品的发源地,我直接做了质心的可视化,基本一个区域的质心比较稳定,而且边界上会出现质心运动(因为边界外没有统计进去),比较简单的解释就是毒品的传播是中心对称的。所以我根据这个结论建模,和电磁场差不多,毒品犯罪对周边有扩散作用的库仑力,同时毒品犯罪多的地区也有对吸毒者的吸引力,我把Sigma drug/distance^{2}作为排斥力(相互作用力,所以实际drug计算的是毒品犯罪的差值),drug作为吸引力。我们把州的变化率求出来,算出县跟随州理论变化和实际变化的差值作为传播的毒品犯罪数,通过二元线性回归,把引力和斥力作为自变量,传播导致的变化作为因变量,得到的置信度很高,所以直接用了。
这两个分别从增长和传播的角度描述了时间和空间的变化,结合之后我们得出了Q1的模型。主要亮点我个人觉得是结合了经济学和物理学的模型,因此在摘要中我特意标明学科交叉。
最后没办法,只能口胡说毒品犯罪增长率最高的点是阈值(类似于生物里的S曲线),因为最难控制。
Q2:
第一题的坑爆发了,我发现自己没办法插入改进。没办法,Bass模型中有一个易感人群的参数,我决定就改他了。我口胡这些社会因素会导致对毒品感兴趣的人比例上升,选了2016年研究,这构成了我们的基调。
首先是K-means,证明相关性存在,然后是Decision-Tree失败,因为数据之间关联度太高,然后我用了相关矩阵发现因素之间存在高度多重共线性。在痛苦地筛选掉所有重复数据和多余数据和缺失数据后(只保留了比例数据,房子和人口相除作为HouseRate),我使用因子分析把因素线性组合成了9个因子,然后用4个因子解释了易感比例。这样勉勉强强能自圆其说了。这一步的亮点我觉得是思路很清晰,把探索的过程详细描述出来了。




有了因子分析之后回答问题就很容易了,统计分析相对于机器学习的好处就在这。
Q3:
因为第二题用了因子分析,所以现在只剩这几个因子了。没办法,只能线性规划了。大体上就是假设因子改变需要成本,通过改变易感比例使得最后算出的毒品犯罪数目不再上涨并且总成本最低,我根据线性规划画了一个3D平面图,以免使得篇幅过于失衡。
敏感性分析:
我把Q2中的因子系数使用在了2015年中,然后用相同的参数预测了当年的易感比例,易感比例还比较准确(废话,因为社会因素也基本没有变啊,求出来的比例当然也很准啊)。然后又对每个州分开来做了拟合,发现差别很大。勉勉强强凑成时空两个维度的敏感度分析了。
真的做题感觉很难入手,尤其是我身兼建模手和编程手,一切按照数据说话。所以胡编乱造模型,编造数据是我最为反感的。这就导致我必须先自己重塑数据才能进行建模,必须找到能让我自己信服的模型。好处是我们的数据可以完美拟合模型,坏处则是我们的模型进度缓慢。但是,至少,我能说自己有了学术诚信,我的东西虽然很烂,好歹不算是学术垃圾了。
另一个点就是可解释性,什么灰色关联时间序列,看起来的确简单,但实际上连最基本的解释性都没有。所以我建模的思路就是完全按照解释性走,第一题采用微分方程模型拟合,第二题用了最有解释性的因子分析(我记得分成了男性幸福指数,女性幸福指数,年龄指数,教育指数)。否则连我自己都不明白的东西,凭什么能让别人看懂。
说实话这道题做的很勉强,比如第一问根本没法概括各种不同毒品的变化,第二问无脑线性回归也没有啥科学性,而且两道题的卡方都很吓人,也就置信度还凑合。在卡了很久之后我的决心就是能建出拟合数据的模型就尽力了,连数据和图都跑不出来全是白搭。很多时候都是抱着试试的态度去无脑试回归,运气好调到一组因素置信度挺高就选了。
最后,MatlabGCK,Python和R赛高!
说真的,我觉得数模比赛的收获应该在于像上文一样,把自己无论是否错误的结论能清晰的解释。不管结果如何,至少能自圆其说。如果只是为了结果,建着自己都不信的模型,编着不知哪来的数据,最后不可能锻炼自己的能力。
我现在都觉得,最重要的,是我独立从头到尾把这么一组恶心的数据彻彻底底从挖掘到清洗到重塑到分析到建模到可视化全部经历了一遍,所有的结论都是我自己推断的,所有的方法都是我自己选择的,甚至于上文我都能单凭着记忆写出。这种能供自己全权掌握并且全权负责的事很少了。
美赛本身的含金量就经常被诟病,M和OF的比例悬殊,不同题目获奖率乃至队伍内部的贡献度也有很大区别,进入OF的核心更在于某个特殊点,所以获得什么奖都没必要太过在意(再怎么样也不如你发好的paper),即使是高教社杯的大佬也可能会偶然失手。
这篇答案的目的不是为了分享M的经验(M真没啥用),主要是对我自己编程分析的总结(即使你只是HM,如果你是物理系,最终真的用数理解决了自己专业内的问题,都比论文获得了好成绩而你只不过是为P图排版打打下手更有意义。美赛这些更为重要,但对于你个人技术栈的提升有多少帮助呢)。美赛固然是一个美术建模语文建模猖獗的比赛,至少你有机会去选择跳出Comfortable Zone。
MCM这款黑色的包销量不是太理想,但是实用性真的很高。可以单肩斜挎,也能做手拿包。尺寸:29×21×2cm,容量也还可以。有多个空间分区。内里也有卡包,比mcm现款手拿包使用会高一些,尺寸也大一些。这个新款软皮,会轻便一些,包身纹路也细腻一些。男士出行可以不用佩戴肩带,做手拿包,然后再配一根手柄。女士出行也可以搭配一根短的黑色链条肩带,做腋下包,搭配浅色衣服,很实用好看。mcm经典包款 mcm包...
正品mk包拉链部位图,1、2、3各部位宽窄比例如下。假mk包的3个比例会不一样。 正品mk包的包装纸上有mk 字迹的水印,假包一般不会有水印 正品mk包的防尘袋做工精致,车线很工整。 正品mk包手柄下的铆钉位置位于正中位置,并且铆钉上的凹槽方向一致高仿mk包的铆钉位置有的会偏离一些。 正品mk包吊牌如下图,海外代购的会有卖场的名字 如红圈内所示。
WDZN电缆和WDZ的区别;1、WDZ与WDZN电缆主要的区别就是WDZN耐火电缆导体绕包一层云母带,使电缆具有燃烧情况下保持正常通电一段时间。3、WDZN耐火电缆的主要特点是电缆除了能在正常的工作条件下传输电力外,电缆在着火燃烧时仍能保持一定时间的正常运行,适用于核电站、地铁、隧道、高层建筑等与防火安全和消防救生有关的地方。
mcm铆钉三折钱包,客供专用PVC配皮,五金不掉色,内衬都带激光logo,官方在售2000左右!这款卖点在于多卡位三折设计,设置了三个大钞位+一个拉链零钱位+10个卡位!配防尘袋包装盒。长款尺寸:19*10,299;短款尺寸15*10,288 mcm短款对折兔子钱包,180 mcm兔子中款三折钱包,399,尺寸14×9.3cm...
三国杀名将传兵粮宝箱多少级开合适?三国黑仔将传兵 s谷物宝箱任何等级,不影响随机概率。《三国杀名将传》红将怎么获得完整红将获取方?三国杀名将传桌游规则 其余武将通过箱子打开,箱子通过打开180个武将、10个五阶、20个五阶、500个皮肤、15个动态皮肤、1个传奇秀、6个神将碎片(合格命令或44个到达将军)获得。
想要被列入爱彼迎Plus,房东们要满足100多个严格条件,包括提供松软的枕头、熨斗和电吹风、烹饪设施、高速无线网络以及瓶装水。同时,他们的房客评分必须达到4.8分以上。一个更隐形的标准是,这些房源在设计方面也要别具一格。如今,爱彼迎Plus的推出,可以看做是对此类争议的回应。也可以说,爱彼迎终于开始向那些传统的保守的酒店客人招手了。一直以来,爱彼迎都被视作酒店业的补充,而非真正的竞争者,尤其是在高端领域。不过其实,在去年爱彼迎花3亿美元收购被称为“奢华版爱彼迎”的奢华短租平台Luxur Retreat时,
超级nice 超级有范儿的M家新品双肩包火爆来袭 超级推荐这一只 巨能装 出游或是出街必备款哦 五金全部有 logo哦 男女通用款出行必入潮品 这只上图必留必买噢 专柜同步上市 尺寸26.32...
Mcm是比蔻驰和mk档次高一点,因为mcm的包包价格比较贵,这只是从价格方面来说。从其他方面比的话,因为蔻驰和mk都是有自己的其他支线的,发展更好,彼此之间的差距不是很大。Mcm是比蔻驰档次高一点,因为mcm的包包价格比较贵,这只是从价格方面来说。从其他方面比的话,因为蔻驰有自己的其他支线的,发展更好,彼此之间的差距不是很大。
中号棕色拼红色,包里面有内层,日常背出门装口红钥匙完全可以,可以单肩斜挎还可以手拿,包包既可以搭配女人味又有时尚感的服装,也可以搭配日常休闲风·
mcm生态软瓷,是建材行业全新的潮流品类,具有时代气息,把握大势。结合2012年三款前景看好的瓷砖新品的优点,喷绘瓷砖色彩丰富,花纹逼真,而软瓷质地自然,可以克隆一切自然之物,更加自然美观;陶瓷片的厚度只有瓷砖的一半,软瓷只有2-4mm,轻载3.6kg/㎡,更加节能低耗;微晶石,造价低廉,可使背景墙营造出珍贵、典雅、奢华等情感。
二、MCM双肩背包的尺寸一般以英寸为单位,包括迷你、小号、中号等多种不同的规格。MCM双肩背包中号尺寸为:16.0 x 13.0 x 6.0 英寸。一、MCM是创始于德国慕尼黑的奢侈时装品牌,创始人是MICHAEL CROMER。MCM的产品以服装、服饰和皮具为主,另外涉及多个领域,包括珠宝、手表、香水、箱包以及小型皮具等在内的超过500种产品。
说到入手MCM的包包,相信很多小伙伴都会选择通过代购的方式,有人问为什么韩国代购的MCM那么便宜,是不是正品呢?今天就来说一下~为什么韩国代购的MCM那么便宜?所谓代购,顾名思义就是支付代购费找人从MCM官网或者专柜买东西,省时省力,并且比自己买可能会便宜很多。但毕竟代购有真有假,海淘购物流程又是很复杂,很难去辨别是不是正品,只有拿到商品才会知道真假,但大部分代购还是可靠的。
mcm包包怎么辨别真假?mcm包包是很多女生都喜欢的品牌,但是越受欢迎的往往造假的越多,那么mcm包包的真假怎么辨别?一起来看看吧!mcm包包怎么辨别真假 辨别mcm包包真假可以从铜牌的清晰程度,册包开口处,拉链,皮质等几个方面判断。mcm包包怎么样 近期想买个书包,lv mini太贵,一般小书包又不好看,但这不妨碍这款MCM卖萌啊~女孩子啊,包包有上班用的,读书用的,去超市用的,去聚会用的,逛街用的,吃饭用的,逛公园用的,所以啊,一个百搭小双肩包还是很有用滴。
在2015年上海车展上,阿斯顿·马丁发布了DBX的概念车,当时发布的车型更像是GT跑车SUV,或许是当时设计师的想法发生了很大的改变,最后才确定了上市版本动力方面,阿斯顿·马丁DBX搭载40T V8双涡轮增压发动机,这是来自奔驰。日前,我们从官方获悉,阿斯顿middot马丁 DBX 新车型将于11月13日中国首发新车将搭载直列六缸发动机,进一步降低DBX车型的起售价此外,该发动机或是阿斯顿middot马丁基于自己的V12发动机研发而来从预告图中看出,背景。
(碎碎念)学生党买了块西铁城cb1120黑色的tb上买的。年前就想买来着兜兜转转看了很久本来想买机械的,但感觉镂空的机械看起来就华而不实。tb上的borman,天王也相中的但一千多不是很好意思开口要钱,年后看了看阿玛尼和seiko,citizen的石英表。后来觉得一千多买个啥功能也没有的阿玛尼太亏,加上原来的卡西欧gw4000的光动能和电波于是中心放到了日本的表上,原先gw4000大一的时候丢了,加上风格现在不是很喜欢,于是乎就看中了西铁城的AO—9000小蓝针1000+,后来到了26号过了英语...