top of page
Open Site Navigation

Xếp hạng kỹ năng phạm lỗi của các cầu thủ với khoa học dữ liệu

“Engage people with what they expect; it is what they are able to discern and confirms their projections. It settles them into predictable patterns of response, occupying their minds while you wait for the extraordinary moment — that which they cannot anticipate.”

― Sun Tzu, The Art of War


Trong bóng đá hiện đại, bạn có thể phá lối chơi của đối thủ bằng những pha phạm lỗi chiến thuật đúng lúc, điều mà các huấn luyện viên thường từ chối công khai đánh giá cao loại "nghệ thuật đen tối" này.

Vậy câu hỏi được đặt ra là:

Liệu có thể làm giảm bớt độ "thô thiển" của chiến thuật này mà không tạo cơ hội tốt hơn cho đối phương bằng cách giảm số lần phạm lỗi?

Và nếu đi xa hơn, chúng ta cũng có thể hỏi:

Những cầu thủ nào cần luyện tập "kỹ năng phạm lỗi" của họ nói chung?


Tệp dữ liệu 360 độ trên sân cung cấp không chỉ vị trí xảy ra các pha phạm lỗi trên sân mà còn thống kê vị trí của những cầu thủ xung quanh.


Sử dụng loại dữ liệu này có thể tạo ra một mô hình tương đối phù hợp để đo lường số thẻ dự kiến cho mỗi lần phạm lỗi. Chúng ta có thể gọi nó là số thẻ mong đợi (xC) bởi vì khái niệm này rất giống với chỉ số bàn thắng mong đợi (xG) được biết đến rộng rãi.


Tóm lại, mô hình này xử lý tất cả các lần phạm lỗi và ước tính xác suất sau đó cầu thủ bị phạt thẻ, bất kể màu sắc là gì. Để đạt được điều này, mô hình hồi quy logistic được sử dụng với các biến đầu vào được trích xuất thủ công từ dữ liệu thô.


Một số biến số được xem xét trong mô hình như:

  • Khoảng cách từ điểm phạm lỗi tới khung thành.

  • Góc nhìn của cầu thủ phạm lỗi tới khung thành.

  • Số người đối phương tấn công khung thành tính từ điểm phạm lỗi

  • Số người phòng ngự khung thành của đội nhà tính từ điểm phạm lỗi

  • Thời gian còn lại của trận đấu

  • Số lần phạm lỗi trước đó của cầu thủ phạm lỗi

  • Số thẻ vàng trước đó trong trận của cầu thủ phạm lỗi

  • Một số biến số khác...

Hiểu được mức độ phù hợp và tầm quan trọng của các biến số nói trên thì chúng ta sẽ có thể tính được xác suất số thẻ mong đợi (xC) được rút ra cho mỗi lần phạm lỗi.


xC sẽ được sử dụng như thế nào?


Một quan niệm sai lầm về thống kê phổ biến trong giới phân tích bóng đá là lấy giá trị quan sát được trừ đi giá trị dự đoán (ví dụ: bàn thắng thực tế trừ đi xG). Mặc dù phương pháp này cho chúng ta cái nhìn tổng thể về hiệu suất của người chơi, nhưng nó không nói lên nhiều điều về kích thước mẫu cơ bản.


Để giải quyết vấn đề này, số lượng thẻ từ một số lỗi nhất định với xác suất ước tính trước đó được giả định là một biến ngẫu nhiên có phân phối nhị thức. Chúng ta có thể xem xét tính toán xác suất nhận được nhiều thẻ hơn so với thực tế.


Nếu xác suất đó là thấp, thì chúng ta có thể nói rằng rất khó để nhận thêm thẻ với những pha phạm lỗi đó. Điều này có thể được dịch là cầu thủ đã tối đa hóa số lượng thẻ tiềm năng.


Dữ liệu EURO 2020 được sử dụng để trình bày kết quả của thử nghiệm, nhưng nó có thể được nhân bản cho bất kỳ giải đấu nào có dữ liệu theo dõi.

Xác suất dự đoán nhận được nhiều thẻ hơn so với thực tế


Nhìn vào 10 "cầu thủ phạm lỗi" hàng đầu sau khi lọc ra những cầu thủ có ít nhất 3 lần phạm lỗi, Cầu thủ có kỹ năng phạm lỗi "gà" nhất là Grzegorz Krychowiak của đội tuyển Ba Lan. Chúng ta có thể nói rằng con số 0,0001 của Krychowiak có nghĩa là nếu có 10.000 cầu thủ phạm lỗi giống nhau, chỉ một trong số họ sẽ nhận được nhiều thẻ hơn Krychowiak.


Một cầu thủ đồng hương của Grzegorz Krychowiak, Robert Lewandowski đứng vị trí thứ 8 trong những anh chàng phạm lỗi "gà" nhất. Lewan có thể là nạn nhân của trường hợp của các vấn đề về kích thước mẫu, dù chỉ một thẻ cũng đủ để đưa một tiền đạo (người thường hoạt động ở những phần sân đối phương) lên đầu danh sách.


Trên đây là sơ lược cách xếp hạng kỹ năng phạm lỗi của một cầu thủ. Tôi phải nhấn mạnh rằng tôi chỉ muốn chứng minh trực giác mà không đi sâu vào các chi tiết thống kê nhàm chán.


Cảm ơn những tác giả đã đóng góp cho bài viết này đặc biệt là Mr.W

Hãy đón chờ DOUS ở những phần tiếp theo… From Dous with Love !

4 lượt xem0 bình luận

Bài đăng gần đây

Xem tất cả
bottom of page