2024美赛C题详细思路全网首发完整模型代码

admin 最新资讯 2024-02-13 57 0

  C题:网球运动的动力 思路交流群:703977763

  在2023年温布尔登绅士队的决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的诺瓦克·德约科维奇。这是德约科维奇自2013年以来首次在温布尔登公开赛失利,并结束了他在大满贯赛事中历史上最伟大的球员之一的非凡表现。

  这场比赛本身就是一场非凡的战斗。[1]·德约科维奇似乎注定要轻松获胜,他以6-1控制了第一盘(7场比赛中赢了6场)。然而,第二盘比赛很紧张,最终阿尔卡雷兹以7-6的比分获胜。第三盘与第一盘相反,阿尔卡拉兹以6-1轻松获胜。在第四盘开始时,年轻的西班牙人似乎完全控制了局面,但不知怎么的,比赛又改变了方向,德约科维奇完全控制了局面,以6-3赢得了这一盘。第五盘也是最后一盘开始时,德约科维奇从第四盘领先,但方向又发生了变化,阿尔卡拉兹控制了局面,以6-4获胜。这场比赛的数据在所提供的“2023-温布尔登-1701”的数据集“match_id”中。当德约科维奇使用“set_no”列等于1时,你可以看到第一回合的所有分数。令人难以置信的波动,有时是很多分数,甚至是比赛,发生在那些似乎有优势的球员,通常被归因于“势头”。

  字典中对动量的一种定义是“通过运动或一系列事件获得的力量或力”。[2]在体育运动中,一个团队或球员可能会觉得他们在比赛/比赛中有动力,或“力量/力量”,但很难衡量这种现象。此外,如果比赛中各种事件如何创造或改变势头,这并不明显。(题外话,世界杯姆巴佩的2球踢碎了我的发财梦,我愿将那两球称之为势头)

  提供2023年温布尔登男子比赛前两轮后的每一分数据。您可以自行选择包含额外的玩家信息或其他数据,但您必须完全记录这些来源。将数据用于:

  (a)开发一个模型,捕捉得分发生时的比赛流程,并将其应用于一个或多个比赛(一个泛化能力强的通用模型,就像你修改一下就能应用在乒乓球上一样)。你的模型应该确定哪个球员在比赛的特定时间表现更好,以及他们的表现有多好(模型预期达到的目标,我们可以用0 or 1判断谁的表现更好,但是我们怎么表示表现有多好或者相当呢,我们这里考虑1-5的量表吧,但是应该很少出现实力相当的情况吧,我猜测,因为后面提到这和发球顺序有关)。提供一个基于模型的可视化功能来描述匹配流程(先把结果做出来,再考虑这里的可视化)。注:在网球比赛中,发球者赢得得分的可能性要高得多。您可能希望以某种方式将其考虑到您的模型中。(既然这里提到了就必须要用了,美赛基本上题目中只要是提到的那就不算是提示,而是要求)

  (b)网球教练怀疑“势头”是否在比赛中起着任何作用(既然第二问才提到势头,并不建议第一问就增加自己的复杂程度,否则第二问你可能没有什么内容可以写的,第一问还是想着往一个简答的通用模型上去靠,这样在后面你想往上面加东西你才好加)。相反,他假设一个球员的比赛和成功运行的变化是随机的。(我们可能需要对这个胜负进行随机检验?就像灵敏度检验那样?但是这里都是标定的整数值……但是我还是觉得只能通过统计测试(如随机性检验)来评估比赛中的转折点是否具有随机性,我想这将会是这个比赛赛题中最难的一件事情)使用你的模型/度量来评估这一说法。

  (c)教练们很想知道是否有一些指标可以帮助确定比赛的节奏何时会从偏向一个球员转向另一个球员。

  (1)利用提供的至少一场比赛的数据(这道题没有自己找数据的必要,把给你的数据能搞明白就好了,这里说了用人家给的,那就用人家给的),开发一个模型来预测比赛中的这些波动(数据题万年不离开预测,其实这个地方简单啊,你找一场作为测试就好啦,其它肯定是训练嘛,然后你的结果肯定是100%准确啊,懂得都懂/dog)。哪些因素似乎是最相关的(如果你用支持向量机/随机森林的话,你应该会很容易得到一个指标重要性的东西,但是时间序列问题这两个模型是否适合呢?存疑!我个人更加倾向于使用transfomer机型分析,这样同时也不失可解释性)(如果有的话(肯定有,知道吧。肯定有!而且没有你也要想办法让它有!!!))?

  (2)考虑到以往比赛中的“势头”波动存在差异,那么当面对不同的对手时,你如何建议球员去应对新的比赛(第一,你要考虑哪些因素最相关;第二,仁者见仁智者见智吧,更多的是见招拆招吧,当然我们写的话,如果一定要给一个模型,还得是运筹学模型吧,但是……运筹学模型利用机器学习的结论?说如何改变提升胜率么?似乎可行,但是还没有得到相对应的结论,不要做过多的构思,有个数就可以了,先把前面的题目做好)?

  (d)在一个或多个其他匹配项上测试您开发的模型(其实他应该给你另一种比赛的数据其测试通用性的,但是既然没有,我们就不考虑这些,测试呗,准确率95%就比较可信)。你对比赛中的波动的预测效果如何(预测效果可以先给一个低的,给自己一个进步空间,后面一问问的不就是模型的修正么,给自己留一点机会)?如果模型有时表现不佳,您能否确定可能需要包含在未来模型中的任何因素(不管怎样,你肯定要进行模型的修正嘛,至于怎么修正的,不管了,深度学习的话多头注意力机制中确定几个头也可以写,你也可以做一些交融实验说明。至于说需要什么因素,抱歉,我还没有想好是什么意思,是需要什么新的变量和信息还是需要对模型进行调整谈一谈模型的展望?但是后面说明模型对其它比赛的普遍已经是在谈模型的展望了……这个问题我们团队还需要讨论,揣摩意思)?你的模式对其他比赛(如女子比赛)、锦标赛、球场表面和乒乓球等其他运动项目有多普遍(不好意思,刚度到这里,之前没有注意有这句话,之前要是我看到这句话我就不在前面强调这个事情了)。

  (e)制作一份不超过25页的报告,包括你的发现,包括一份一到两页的备忘录,总结你的结果,建议教练发挥“势头”的作用,以及如何准备球员应对影响网球比赛流程的事件。(报告要精美,做的和海报一样,然后这两个问题要回答!!一定要有所回应!!!,至于报告怎么写,网上很多思路,我们写到报告的时候也会给大家一些注意事项)

  点击链接加入群聊【science美赛交流群1】:正在跳转

2024美赛C题详细思路全网首发完整模型代码

2024美赛C题详细思路全网首发完整模型代码

评论