Cách những người giỏi nhất trong bóng đá đang sử dụng dữ liệu phân tích để tìm ra lợi thế
Bộ não của các bộ phận dữ liệu bóng đá từ khắp nơi trên thế giới đã đổ về Stamford Bridge vào tuần trước.
Tại một hội nghị phân tích tương tự cách đây một thập kỷ, căn phòng sẽ có nhiều người hoài nghi dữ liệu hơn nhiều, với rất ít học viên làm việc tại các câu lạc bộ.
Xem thêm:
Nhưng ngày nay, nhiều câu lạc bộ hơn bao giờ hết có nhà phân tích dữ liệu, nhà khoa học hoặc kỹ sư trong tòa nhà, chi nhiều tiền hơn trước đây cho dữ liệu và công cụ, đồng thời coi phân tích là phương tiện chính xác để tìm ra lợi thế.
Sự kiện được tổ chức bởi Statsbomb, công ty hoạt động trong không gian chuyên nghiệp, truyền thông và cờ bạc. Các giao dịch với phần lớn các câu lạc bộ ở Premier League, cùng với các đội từ Roma ở Ý đến Alianza Lima của Peru, phản ánh sự phát triển của công ty. Nó cũng quan tâm đến việc phát triển việc sử dụng dữ liệu trong bóng đá nữ, với các đội trong các giải đấu đó có thể truy cập vào nền tảng hàng đầu của họ – Statsbomb IQ – miễn phí.
Mặc dù vậy, “Thực hiện phân tích” không phải là một việc nhị phân và tác động đến việc ra quyết định tại một câu lạc bộ có thể bị hạn chế nếu bộ phận dữ liệu thiếu nhân lực, thiếu kinh phí hoặc thiếu kỹ năng hoặc công việc của bộ phận này được định giá thấp và mọi người không nghe. Trường hợp cụ thể: trưởng bộ phận phân tích của một câu lạc bộ đã được theo dõi bên trong một trong các cuộc đàm phán đã được yêu cầu đặt hàng một số vật tư CNTT cho một thành viên khác .
Bóng đá chắc chắn thua các môn thể thao khác.
Ví dụ, hầu hết các nhượng quyền thương mại bóng rổ NBA sẽ có bốn hoặc năm nhân viên phân tích. Tại Premier League, người ta cho rằng chỉ có Liverpool và Manchester City có số lượng phân tích cao hơn con số đó.
Tuy nhiên, những người thuê đang đến.
Aston Villa dự kiến sẽ bổ nhiệm một nhà khoa học dữ liệu để củng cố nhóm nghiên cứu bóng đá của họ trong những tuần tới và sẽ tìm cách mở rộng bộ phận trước khi kết thúc mùa giải này. Everton hiện đang tìm kiếm một kỹ sư dữ liệu để giúp tăng cường cung cấp phân tích nội bộ của họ. Trong hội nghị này, có tin tức cho biết Manchester United đã thuê giám đốc khoa học dữ liệu đầu tiên của họ.
Xem xét ba trong số các phiên trong ngày cho chúng ta một cái nhìn tổng quan về vị trí của phân tích bóng đá và cung cấp một số gợi ý về những gì tương lai có thể xảy ra.
Giám đốc nghiên cứu của Liverpool, Tiến sĩ Ian Graham, đã có một bài nói chuyện tập trung vào cách tối đa hóa tác động của phân tích trong một câu lạc bộ.
Như trường hợp của Graham, bài thuyết trình rất thú vị, chứa đầy những giai thoại khiến cánh mày râu phải sửng sốt đồng thời cực kỳ dễ hiểu. “Giống như bạn đang trò chuyện với một người bạn đời ở quán rượu vậy,” một nhà phân tích đáng kính của Championship lưu ý.
Thông điệp của Graham là tập trung hết sức có thể vào công việc có ảnh hưởng. Đó có vẻ như là lẽ thường, nhưng lẽ thường trong bóng đá không phải là lẽ thường tình. So với việc cố gắng ngăn ngừa chấn thương hoặc cải thiện hiệu suất bằng cách sử dụng dữ liệu, Graham đã nói về cách “tuyển dụng và giữ chân cầu thủ là công việc quan trọng nhất, theo hệ số 10”. Vài người trong phòng không đồng ý.
Graham cũng cho thấy, với một số phép toán cơ bản, việc tuyển dụng và giữ chân cầu thủ có thể khó khăn như thế nào. Trong một ví dụ đơn giản, anh ấy giải thích cách phân chia khoảng 50:50 giữa chuyển nhượng thành công và chuyển giao thất bại, ngay cả khi bạn có 90% độ tin cậy trong một nhóm danh mục, chẳng hạn như trong biểu đồ bên dưới.
Điều đó, có lẽ, có thể giải thích một cách nào đó việc Liverpool thiếu các giao dịch chuyển nhượng trong mùa hè này, ngoại trừ việc Ibrahima Konate được mua từ RB Leipzig và cầu thủ trẻ Harvey Elliott trở thành thành viên chính thức của đội một. Tốt hơn là giữ những cầu thủ có khả năng mà bạn biết và có thể tin tưởng, giữ họ ở những năm đỉnh cao (Trent Alexander-Arnold) hoặc sau đỉnh cao (Jordan Henderson), thay vì tung xúc xắc cố gắng thay thế họ.
Cũng có một cái nhìn sâu sắc về suy nghĩ của Liverpool từ quan điểm chiến lược chuyển nhượng, với động thái của Roberto Firmino vào năm 2015 được sử dụng làm ví dụ. Firmino còn hai năm trong hợp đồng của anh ấy tại Hoffenheim, một đội bóng hạng trung của Bundesliga, vào thời điểm đó. Anh ấy không có trận đấu quốc tế nào cho Brazil và hầu như không ghi bàn, ghi 38 bàn trong 126 trận ra sân, khoảng 0,31 bàn mỗi 90 phút – con số được đưa ra bởi Che Adams và David McGoldrick mùa trước ở Premier League.
Không điều gì trong số đó phù hợp với những gì bạn có thể mong đợi cho một tiền đạo xuất phát trong một đội Premier League ưu tú, nhưng đó chính xác là suy nghĩ của Liverpool. Graham tóm tắt: “Hãy tìm ra những gì được định giá quá cao bởi thị trường chuyển nhượng và trả ít hơn, tìm ra những gì được định giá thấp hơn và đó là giá rẻ”.
Cuối cùng, cũng có một cái nhìn sâu sắc về các chỉ số mà Liverpool sử dụng.
Graham đã nói về cách một cầu thủ “tác động đến hiệu số bàn thắng so với cầu thủ trung bình ở Premier League” được quan tâm đặc biệt, mặc dù cách tính toán đó được giữ im lặng.
Có lẽ là lựa chọn thông minh để giữ, với giám đốc thể thao của Liverpool, Michael Edwards, một trong số những người có mặt trong phòng.
Nếu cuộc nói chuyện của Graham chỉ tập trung vào các chi tiết kỹ thuật, thì bài nói chuyện của Tiến sĩ Will Morgan, một nhà khoa học dữ liệu tại Statsbomb, lại là bất cứ điều gì ngoại trừ.
Morgan đang sử dụng tập dữ liệu “360” của Statsbomb, bộ dữ liệu này cải tiến dữ liệu sự kiện truyền thống – mọi cú sút, đường chuyền, xử lý bóng, v.v. – bằng cách thêm vị trí và đội của từng cầu thủ trên cảnh quay phát sóng tại thời điểm hành động.
Ví dụ: dữ liệu sự kiện truyền thống trông giống như sau:
Mức độ chi tiết gia tăng đó mở ra nhiều góc độ phân tích – đặc biệt là những tình huống mà điều gì đó không xảy ra nhưng có thể xảy ra.
Cuộc nói chuyện của Morgan tập trung vào việc dự đoán liệu một lần sở hữu bóng sẽ diễn ra trong thời gian ít hơn năm giây trước khi mất bóng, lâu hơn năm giây trước khi mất bóng hay có khả năng dẫn đến một nỗ lực ghi bàn. Tìm hiểu những lý do tại sao việc cầm bóng có thể không kéo dài trong thời gian đầu là điều thú vị – chẳng hạn như có nhiều áp lực lên bóng, hoặc có rất ít các phương án chuyền bóng rõ ràng.
Việc xác định những “người suýt trượt” này cũng phù hợp với bối cảnh huấn luyện. Các tình huống trong trò chơi được tìm thấy bằng mô hình của Morgan có thể được liên kết với video, cho phép huấn luyện viên và nhà phân tích đặt câu hỏi tại sao điều gì đó lại xảy ra, sử dụng câu trả lời để thông báo chiến thuật trong một trò chơi trong tương lai hoặc để cung cấp lại quan điểm huấn luyện cá nhân cho người chơi.
Mô hình như thế này cũng được sử dụng trong việc tuyển dụng rõ ràng, chẳng hạn như tìm ra những cầu thủ xuất sắc trong việc luôn giữ quyền sở hữu trong những tình huống khó khăn.
Đó là công việc phức tạp, nhưng kết quả đầu ra rõ ràng và phù hợp với xu hướng vĩ mô hơn về nền kinh tế và cuộc sống đang diễn ra vào năm 2021: dữ liệu ngày càng tốt hơn có nghĩa là công việc có thể được tự động hóa, nhấn mạnh hơn nữa vào các kỹ năng cần thiết để diễn giải và sử dụng dữ liệu thay vì thu thập dữ liệu ngay từ đầu.
Một điểm thu hút lớn khác trong ngày là ban giám đốc thể thao, bao gồm Victor Orta của Leeds United, James Cryne từ Barnsley của Championship và Will Kuntz của Major League Soccer’s Los Angeles FC.
Hội đồng đã đề cập đến các chủ đề bao gồm tác động của Brexit và giới thiệu điểm xác nhận của cơ quan quản lý (GBE) – hệ thống đánh giá khả năng đủ điều kiện chơi ở Anh của một người chơi – về việc tuyển dụng cả người chơi và người quản lý, đến cách bộ ba nhân vật có ảnh hưởng học hỏi từ những sai lầm của họ và cải thiện quy trình tại câu lạc bộ của họ.
Cryne và Orta, với các câu lạc bộ mà họ làm việc, đều đặc biệt tiêu cực khi xem xét tác động của GBE đối với trò chơi. Quan điểm của Orta là, nếu mục tiêu cuối cùng là tăng chất lượng và số lượng tài năng tiếng Anh đến từ các học viện, thì việc hạn chế nguồn nhân tài mà các câu lạc bộ có thể tuyển dụng sẽ có hại hơn là hữu ích. Có chất lượng sân cỏ tốt hơn sẽ nâng cao tiêu chuẩn và tạo ra nguồn nhân tài tốt hơn nhưng giảm chất lượng đó sẽ chỉ gây khó khăn hơn.
Cryne, người cũng là giám đốc và đồng sở hữu của Barnsley, đã lưu ý đến việc những người như Valerien Ismael và Gerhard Struber – hai người quản lý gần đây được thuê cho câu lạc bộ Yorkshire từ lục địa châu Âu hiện đang ở West Bromwich Albion và MLS bên New York Red Bulls. tương ứng – sẽ khó thuê hơn bây giờ do Brexit.
Orta cũng nói về một số nỗ lực trước đó của anh ấy trong lĩnh vực phân tích. Với bộ dữ liệu bị hạn chế, anh ấy đã xem xét việc tạo các chỉ số dựa trên xếp hạng người chơi từ các tờ báo lớn ở châu Âu – Marca, L’Equipe, AS, v.v. – và sử dụng nó như một bộ lọc do thám. Điểm tưởng tượng cũng là một ví dụ được nêu ra như một tập dữ liệu ban đầu được khám phá như một phương tiện tìm kiếm những người chơi bị đánh giá thấp.
Kuntz’s LAFC rõ ràng hoạt động bên ngoài châu Âu, và phải đối mặt với mê cung các quy tắc MLS. Sự gần gũi của anh ấy với thị trường thể thao Mỹ cũng mang lại cho anh ấy một cái nhìn khác và anh ấy lưu ý rằng trong ba hoặc bốn năm qua, bóng đá đã “có những trận đánh giống như bóng chày 15 năm trước”. Thực tế là những cuộc chiến giành ảnh hưởng, đầu vào và sự hiểu biết đang diễn ra là một dấu hiệu chắc chắn cho thấy sự tiến bộ của phân tích trong bóng đá.
Kuntz cũng nói về việc xem xét nghiêm ngặt mọi kỳ chuyển nhượng để đặt câu hỏi điều gì đã diễn ra tốt đẹp và điều gì có thể được cải thiện.
Cuốn sách Superforecasting năm 2015 đã được Orta kiểm tra tên trong hội đồng hội thảo, với các bài đánh giá sâu rộng do Kuntz ủng hộ, gợi nhớ đến một trong những điểm chính mà tác giả của nó, Philip Tetlock đã tìm thấy.
Vì vậy, chúng tôi đã học được những gì?
Các bộ dữ liệu, chẳng hạn như Statsbomb’s 360, và các công cụ cần thiết để tận dụng tối đa chúng đang làm cho việc thực hiện các phân tích phức tạp nhưng sâu sắc và xây dựng các công cụ mà bất kỳ ai trong một câu lạc bộ đều có thể truy cập để đưa ra các thông tin khách quan, các quyết định. Các đội bây giờ bị giới hạn bởi tham vọng và sự đầu tư của họ chứ không phải thiếu nguyên liệu.
Tuy nhiên, lợi thế thực sự khi áp dụng phân tích không phải là mô hình của bạn tốt đến mức nào (mặc dù một mô hình tồi tệ hơn là không có một chút nào) hay bạn thông minh đến mức nào, mà là cách bạn có thể mua và có một tác động thực sự, trực tiếp đến khóa học mà câu lạc bộ của bạn tham gia.
Graham sẽ vui vẻ đề cập đến một số chỉ số mà Liverpool sử dụng trong việc chuyền bóng, hoặc cách họ có một con mắt quan tâm như vậy khi tập trung gần như toàn bộ sức lực vào việc tuyển dụng và giữ chân cầu thủ. Tương tự, Orta sẽ nói về việc dễ dàng làm việc với huấn luyện viên trưởng của Leeds, Marcelo Bielsa, bởi vì ông ấy biết chính xác loại cầu thủ mà mình muốn. Kuntz sẽ cho bạn biết tầm quan trọng của việc tìm kiếm để học hỏi từ những trận thắng cũng như những trận thua của bạn.
Tuy nhiên, điều bạn sẽ không bao giờ được nói là cách họ giải quyết xung đột trong những ngày trước đó, khiến mọi người cùng đi về một hướng. Họ cũng sẽ không nói – ít nhất là công khai – cách cấu trúc các bài đánh giá sau cửa sổ này hoặc cách dịch hồ sơ người chơi của người quản lý thành thứ gì đó có thể tìm kiếm được bằng dữ liệu.
Họ sẽ không cho bạn biết những việc này được thực hiện như thế nào, chỉ là bạn nên làm vì chúng đã làm việc cho họ.
Cuối cùng, đó sẽ luôn là thách thức mà các câu lạc bộ phải đối mặt khi cố gắng trở nên thông minh hơn và nhiều thông tin hơn.
Đôi khi các cạnh là những gì còn lại trên các trang trình bày – không phải là những gì thực sự có trên chúng.
Để lại một phản hồi