欢迎访问世界杯·竞猜(中国)官方网站!

足球赛事

您现在的位置是: 主页 > 体育资讯 > 足球资讯

足球资讯

MLFA(2):足球数据判辨常用数据集介绍2022世界杯押注软件

发布时间:2023-05-27 11:13 足球资讯 作者:小编
  要将机器进修算法操纵于足球数据瓦解,就务必先有一套对待角逐内容的数据集。本专栏的第二篇作品将介绍足球数据判辨范围常用的两种数据典范:   事项数据(event data, a.k.a. play-by-play data)描画了一场竞争中每次有球操持的精密讯歇。几乎而言,第三方数据公司从竞争录像中由人工标注出每一次解决球事变,比方传球、射门、盘带、争顶等等,并记载下该事情...

MLFA(2):足球数据判辨常用数据集介绍2022世界杯押注软件(图1)

  要将机器进修算法操纵于足球数据瓦解,就务必先有一套对待角逐内容的数据集。本专栏的第二篇作品将介绍足球数据判辨范围常用的两种数据典范:

  事项数据(event data, a.k.a. play-by-play data)描画了一场竞争中每次有球操持的精密讯歇。几乎而言,第三方数据公司从竞争录像中由人工标注出每一次解决球事变,比方传球、射门、盘带、争顶等等,并记载下该事情的球员、时辰、名望(在球场上的坐标)以及其我详细音讯(比方应用的左脚照样右脚、是否胜利)。据统计,一场竞赛的事情数据大意包蕴 1700 次事变,且此中约一半的变乱为传球。

  Wyscout 的悍然数据涵盖了 1941 场逐鹿, 约 300 万个事项,涉及 4299 名球员。实在包蕴的赛事如下表所示。

  StatsBomb 的果然数据涵盖的赛事控制极端精深,不仅两全男足女足,而且期间跨度上包含了少许年初较永恒的角逐,如英超 03/04 赛季中赛季不败的阿森纳的比赛、梅西在巴塞罗那的生涯中通盘出场的西甲比赛、99/00 赛季起的个体欧冠决赛。的确包罗的赛事如下表所示。

  在传统的事件数据中,一个变乱的音讯仅包含了与该事件关系的球员场所,而场上其大家球员的名望不会被记载。而 StatsBomb 的数据则包罗凝固帧,即同时记载了事变爆发瞬间镜头中其2022世界杯押注竞猜我们球员的位子。可是,StatsBomb 的公开数据仅在 2020 年欧洲杯的 51 场角逐中为每个事故都纪录了固结帧(这个数据类型被 StatsBomb 称为 360 data),而在其全部人赛事中只对每脚射门记载了冻结帧。

  追踪数据(tracking data)记载了一场逐鹿中每时每刻足球和场上球员的场所坐标。这类数据是由球员角逐时的穿着制造直接搜集获得,或许通过计算机视觉的谋略从录像中估算而得。出手进的技巧开发可能得到帧率达 25 Hz 的追踪数据,即每场竞赛约 14 万帧数据。比较闻名的追踪数据提供商有Matrica Sports、Stats Perform、Second Spectrum等。

  然则,思要获取场上完整球员的追踪数据须要在场馆内安置反应的硬件措施,并非每一场逐鹿都有条件获得这类数据。退而求其次,全班人无妨只谅解直播镜头中可见的球员处所,这就衍生出了直播镜头追踪数据(broadcast tracking data)。这类数据的需要商有SkillCorner、Sportlogiq等。

  Matrica Sports 的果然数据包罗三场匿名逐鹿,帧率为 25 Hz。除了场上统统球员的追踪数据外,还需要了与追踪数据期间对齐的变乱数据。同时拥不常间对齐的追踪数据和变乱数据平时更有利于理解任务的进行。

  SkillCorner 的悍然数据包括了 19/20 赛季五大联赛冠亚军之间的共 9 场竞赛[2]的直播镜头追踪数据,帧率为 10 Hz。由于 SkillCorner 己方并不是事件数据供应商,因而,需要时,行使这些数据须要将其和其谁们供应商的变乱数据举行时候对齐。

  鄙人图中,大家没合系显露游移到该类数据只能追踪到镜头区域内的球员。据统计,直播镜头追踪数据平均每帧只能踩缉到 14 名场上球员。

  由于足球场地大、人员多的特质,数据网络难度大,起步也较晚。在足球除外,比如篮球,NBA 从 2013 年起就引入了 Stats Perform 的 SportVU 体例,在场馆内安设开发搜集追踪数据。

  固然现在已有良多数据供应商起首搜集足球数据,但免费竟然的数据相应付供应商支配的数据依旧屈指可数,妄思将来能有更多的竟然数据提供给拿不到合营的商讨者和足球判辨的业余爱好者操纵,鞭策足球数据认识周围的工夫上进。

广告位