The Self-Improving Loop — How Every Closed Trade Teaches the Engine

TÍNH NĂNG MỚI

Vòng Lặp Tự Cải Thiện — Mỗi Giao Dịch Đã Đóng Dạy Cho Engine

26 tháng 3, 2026

Hầu hết các bot giao dịch đều bị đóng băng theo thời gian. Logic mà chúng chạy hôm nay chính là logic mà chúng đã chạy ngày đầu tiên. Nếu chúng từng thực hiện một giao dịch tồi, chúng sẽ vui vẻ thực hiện lại chính giao dịch tồi đó vào ngày mai. Chúng tôi quyết định rằng đó là một giới hạn không thể chấp nhận được.

Tính đến hôm nay, StormBot đi kèm một vòng lặp tự cải thiện — năm mô-đun lồng vào nhau theo dõi, phân tích và học từ mỗi giao dịch đã đóng. Chiến lược thích nghi trên cơ sở các kết quả thực tế, không phải lý thuyết.

Đây là chức năng của từng mô-đun:

1. Trình theo dõi kết quả giao dịch & máy tính tỷ lệ thắng

Mỗi lệnh thoát — qua stop-loss, mục tiêu lợi nhuận, hoặc giải quyết thị trường — được ghi nhận vĩnh viễn với toàn bộ ngữ cảnh: câu hỏi thị trường, giá vào, giá thoát, thành phố nào, ngày nào, chế độ giao dịch nào đang hoạt động, các mô hình dự báo đã dự đoán gì và P&L cuối cùng.

Từ dữ liệu này, engine tính tỷ lệ thắng thời gian thực được phân tách theo thành phố, chế độ giao dịch, khoảng giá vào, và khoảng thời gian. Chỉ sau vài ngày giao dịch, các mô hình bắt đầu xuất hiện. Có thể bot thắng 85% các lệnh London nhưng chỉ 45% Seoul. Có thể nó cực kỳ hiệu quả với entry dưới 15¢ nhưng kém trên 40¢. Đây không phải linh cảm — đó là những con số thực từ giao dịch thật, đưa thẳng vào quyết định tiếp theo của Claude.

2. Vòng phản hồi sau khi giải quyết — theo dõi độ chính xác của mô hình

Đây là khoa học khí tượng thuần túy. Sau khi mỗi thị trường được giải quyết, engine ghi lại những gì mỗi mô hình thời tiết đã dự đoán so với những gì thực sự đã xảy ra. Theo thời gian, điều này xây dựng một cơ sở dữ liệu độ chính xác mô hình theo thành phố.

Kết quả? Sau 30 ngày dữ liệu, bot có thể biết rằng "ECMWF nhất quán ấm hơn 0,8°C cho Seoul vào tháng 3" hoặc "GFS lạnh hơn 1,2°C cho Miami vào mùa hè." Các thiên lệch hệ thống này được tự động đưa vào tính toán đồng thuận. Không có bot giao dịch thời tiết nào khác có điều này — hầu hết đều coi tất cả các mô hình như nhau bất kể thành tích cho một thành phố và mùa cụ thể.

3. Claude tự đánh giá các giao dịch của mình — phân tích sau giao dịch bằng AI

Đây là mô-đun mạnh mẽ nhất. Cứ mỗi 30 phút, bot xem xét các giao dịch thua lỗ gần đây của nó và gửi từng giao dịch trở lại Claude với một câu hỏi đơn giản: "Đã sai ở đâu?"

Claude xem xét lệnh trong nhìn lại — dữ liệu dự báo có sẵn, giá vào lệnh, kết quả thực tế — và viết một bài hậu kỳ ngắn gọn: sai lầm là gì và một quy tắc khả thi để tránh lặp lại trong tương lai. Những bài học này tích lũy thành một "playbook" được tiêm vào mỗi prompt AI tương lai.

Sau 100 lệnh, Claude về cơ bản đã viết cuốn sổ tay giao dịch của riêng mình dựa trên kinh nghiệm thực tế. Ví dụ bài học chúng tôi thấy trong thử nghiệm:

"Tránh BUY_YES trên 30¢ ở các thành phố châu Á — thị trường thường đã hiệu quả ở mức giá đó"
"Khi GFS và ECMWF chênh lệch hơn 2°C, luôn SKIP — độ bất định quá cao"
"Nhiệt độ ở Seoul vào tháng 3 luôn thấp hơn dự đoán đồng thuận của các mô hình — áp dụng hiệu chỉnh -1°C"

4. Hiệu chỉnh độ tin cậy của AI

Khi Claude nói rằng một giao dịch có độ tin cậy "VERY_HIGH", thực tế nó thắng bao nhiêu lần? Mô-đun này theo dõi câu trả lời chính xác. Mức độ tin cậy của mỗi giao dịch được ghi lại cùng với kết quả của nó, xây dựng một bảng hiệu chỉnh:

    VERY_HIGH: tỷ lệ thắng thực tế 72,3% (47/65 giao dịch)

    HIGH: tỷ lệ thắng thực tế 58,1% (36/62 giao dịch)

    MEDIUM: tỷ lệ thắng thực tế 41,2% (14/34 giao dịch)

    LOW: tỷ lệ thắng thực tế 25,0% (3/12 giao dịch)

Dữ liệu này được tiêm trực tiếp vào prompt của Claude. Nếu Claude thấy rằng các quyết định VERY_HIGH của mình chỉ thắng 60%, nó sẽ tự nhiên trở nên chọn lọc hơn — chỉ dành VERY_HIGH cho các kết quả thực sự chắc chắn. Độ tin cậy của AI trở nên thực sự có ý nghĩa thay vì tùy tiện, điều này trực tiếp cải thiện định cỡ lệnh (vì các cược lớn hơn được đặt ở các mức độ tin cậy cao hơn).

5. Bối cảnh hiệu suất luân phiên — nhận diện mẫu

Mỗi phân tích AI giờ đây nhận được bản tóm tắt hiệu suất 7 ngày luân phiên, hiển thị:

Hồ sơ thắng/thua tổng thể và P&L ròng
Các thành phố hiệu suất tốt nhất (nơi bot thắng đều đặn)
Các thành phố hiệu suất kém nhất (nơi nên giao dịch thận trọng hoặc tránh)
Tỷ lệ thắng theo phạm vi giá vào (<15¢, 15-40¢, >40¢)

Claude tự nhiên điều chỉnh hành vi dựa trên ngữ cảnh này. Nếu các lệnh ở London đang trên chuỗi 9 thắng, nó nghiêng vào cơ hội London quyết liệt hơn. Nếu Seoul đã thua liên tục, nó đặt ngưỡng cao hơn trước khi đề xuất các lệnh Seoul. Chiến lược của bot tiến hóa hằng ngày dựa trên những gì thực sự hiệu quả.

Hiệu ứng cộng dồn

Năm mô-đun này không hoạt động độc lập — chúng cộng hưởng. Kết quả lệnh đưa vào dữ liệu hiệu chuẩn. Dữ liệu hiệu chuẩn điều chỉnh mức độ tin cậy. Mức độ tin cậy được điều chỉnh thay đổi định cỡ vị thế. Hậu kỳ tạo ra bài học. Bài học ngăn chặn sai lầm lặp lại. Theo dõi thiên lệch mô hình hiệu chỉnh dự báo. Dự báo tốt hơn cải thiện tỷ lệ thắng. Tỷ lệ thắng tốt hơn cộng hưởng thành nhiều lợi nhuận hơn. Bot chạy trong 30 ngày về cơ bản thông minh hơn bot chỉ chạy trong 3 ngày. Đây là tính năng quan trọng nhất của StormBot — và nó đang hoạt động ngay bây giờ.

Đọc tiếp

Tất cả bài viết