增加 alpha 检测工具

4 weeks ago · 0ef8731055
parent d8c5c04581
commit 0ef8731055
3 changed files with 1460 additions and 0 deletions
--- a/alpha_check/machine_lib.py
+++ b/alpha_check/machine_lib.py
@ -0,0 +1,760 @@
+import requests
+from os import environ
+from time import sleep
+import time
+import json
+import pandas as pd
+import random
+import pickle
+from urllib.parse import urljoin
+from itertools import product
+from itertools import combinations
+from collections import defaultdict
+import pickle
+ 
+ 
+ 
+basic_ops = ["reverse", "inverse", "rank", "zscore", "quantile", "normalize"]
+ 
+ts_ops = ["ts_rank", "ts_zscore", "ts_delta",  "ts_sum", "ts_delay", 
+          "ts_std_dev", "ts_mean",  "ts_arg_min", "ts_arg_max","ts_scale", "ts_quantile"]
+ 
+ops_set = basic_ops + ts_ops 
+
+def login():
+    
+    username = ""
+    password = ""
+ 
+    # Create a session to persistently store the headers
+    s = requests.Session()
+ 
+    # Save credentials into session
+    s.auth = (username, password)
+ 
+    # Send a POST request to the /authentication API
+    response = s.post('https://api.worldquantbrain.com/authentication')
+    print(response.content)
+    return s  
+
+
+def get_datasets(
+    s,
+    instrument_type: str = 'EQUITY',
+    region: str = 'USA',
+    delay: int = 1,
+    universe: str = 'TOP3000'
+):
+    url = "https://api.worldquantbrain.com/data-sets?" +\
+        f"instrumentType={instrument_type}&region={region}&delay={str(delay)}&universe={universe}"
+    result = s.get(url)
+    datasets_df = pd.DataFrame(result.json()['results'])
+    return datasets_df
+
+
+def get_datafields(
+    s,
+    instrument_type: str = 'EQUITY',
+    region: str = 'USA',
+    delay: int = 1,
+    universe: str = 'TOP3000',
+    dataset_id: str = '',
+    search: str = ''
+):
+    if len(search) == 0:
+        url_template = "https://api.worldquantbrain.com/data-fields?" +\
+            f"&instrumentType={instrument_type}" +\
+            f"&region={region}&delay={str(delay)}&universe={universe}&dataset.id={dataset_id}&limit=50" +\
+            "&offset={x}"
+        count = s.get(url_template.format(x=0)).json()['count'] 
+        
+    else:
+        url_template = "https://api.worldquantbrain.com/data-fields?" +\
+            f"&instrumentType={instrument_type}" +\
+            f"&region={region}&delay={str(delay)}&universe={universe}&limit=50" +\
+            f"&search={search}" +\
+            "&offset={x}"
+        count = 100
+    
+    datafields_list = []
+    for x in range(0, count, 50):
+        datafields = s.get(url_template.format(x=x))
+        datafields_list.append(datafields.json()['results'])
+ 
+    datafields_list_flat = [item for sublist in datafields_list for item in sublist]
+ 
+    datafields_df = pd.DataFrame(datafields_list_flat)
+    return datafields_df
+
+def get_vec_fields(fields):
+
+    # 请在此处添加获得权限的Vector操作符
+    vec_ops = ["vec_avg", "vec_sum"]
+    vec_fields = []
+ 
+    for field in fields:
+        for vec_op in vec_ops:
+            if vec_op == "vec_choose":
+                vec_fields.append("%s(%s, nth=-1)"%(vec_op, field))
+                vec_fields.append("%s(%s, nth=0)"%(vec_op, field))
+            else:
+                vec_fields.append("%s(%s)"%(vec_op, field))
+ 
+    return(vec_fields)
+
+def process_datafields(df):
+
+    datafields = []
+    datafields += df[df['type'] == "MATRIX"]["id"].tolist()
+    datafields += get_vec_fields(df[df['type'] == "VECTOR"]["id"].tolist())
+    return ["winsorize(ts_backfill(%s, 120), std=4)"%field for field in datafields]
+
+def ts_factory(op, field):
+    output = []
+    #days = [3, 5, 10, 20, 60, 120, 240]
+    days = [5, 22, 66, 120, 240]
+    
+    for day in days:
+    
+        alpha = "%s(%s, %d)"%(op, field, day)
+        output.append(alpha)
+    
+    return output
+
+def first_order_factory(fields, ops_set):
+    alpha_set = []
+    #for field in fields:
+    for field in fields:
+        #reverse op does the work
+        alpha_set.append(field)
+        #alpha_set.append("-%s"%field)
+        for op in ops_set:
+ 
+            if op == "ts_percentage":
+ 
+                alpha_set += ts_comp_factory(op, field, "percentage", [0.5])
+ 
+            elif op == "ts_decay_exp_window":
+ 
+                alpha_set += ts_comp_factory(op, field, "factor", [0.5])
+ 
+            elif op == "ts_moment":
+ 
+                alpha_set += ts_comp_factory(op, field, "k", [2, 3, 4])
+ 
+            elif op == "ts_entropy":
+ 
+                alpha_set += ts_comp_factory(op, field, "buckets", [10])
+ 
+            elif op.startswith("ts_") or op == "inst_tvr":
+ 
+                alpha_set += ts_factory(op, field)
+ 
+            elif op.startswith("vector"):
+ 
+                alpha_set += vector_factory(op, field)
+ 
+            elif op == "signed_power":
+ 
+                alpha = "%s(%s, 2)"%(op, field)
+                alpha_set.append(alpha)
+ 
+            else:
+                alpha = "%s(%s)"%(op, field)
+                alpha_set.append(alpha)
+ 
+    return alpha_set
+
+
+def load_task_pool(alpha_list, limit_of_children_simulations, limit_of_multi_simulations):
+    '''
+    Input:
+        alpha_list : list of (alpha, decay) tuples
+        limit_of_multi_simulations : number of children simulation in a multi-simulation
+        limit_of_multi_simulations : number of simultaneous multi-simulations
+    Output:
+        task : [10 * (alpha, decay)] for a multi-simulation
+        pool : [10 * [10 * (alpha, decay)]] for simultaneous multi-simulations
+        pools : [[10 * [10 * (alpha, decay)]]]
+
+    '''
+    tasks = [alpha_list[i:i + limit_of_children_simulations] for i in range(0, len(alpha_list), limit_of_children_simulations)]
+    pools = [tasks[i:i + limit_of_multi_simulations] for i in range(0, len(tasks), limit_of_multi_simulations)]
+    return pools
+
+def multi_simulate(alpha_pools, neut, region, universe, start):
+
+    s = login()
+
+    brain_api_url = 'https://api.worldquantbrain.com'
+
+    for x, pool in enumerate(alpha_pools):
+        if x < start: continue
+        progress_urls = []
+        for y, task in enumerate(pool):
+            # 10 tasks, 10 alpha in each task
+            sim_data_list = generate_sim_data(task, region, universe, neut)
+            try:
+                simulation_response = s.post('https://api.worldquantbrain.com/simulations', json=sim_data_list)
+                simulation_progress_url = simulation_response.headers['Location']
+                progress_urls.append(simulation_progress_url)
+            except:
+                print("location key error: %s"%simulation_response.content)
+                sleep(600)
+                s = login()
+
+        print("pool %d task %d post done"%(x,y))
+
+        for j, progress in enumerate(progress_urls):
+            try:
+                while True:
+                    simulation_progress = s.get(progress)
+                    if simulation_progress.headers.get("Retry-After", 0) == 0:
+                        break
+                    #print("Sleeping for " + simulation_progress.headers["Retry-After"] + " seconds")
+                    sleep(float(simulation_progress.headers["Retry-After"]))
+
+                status = simulation_progress.json().get("status", 0)
+                if status != "COMPLETE":
+                    print("Not complete : %s"%(progress))
+
+                """
+                #alpha_id = simulation_progress.json()["alpha"]
+                children = simulation_progress.json().get("children", 0)
+                children_list = []
+                for child in children:
+                    child_progress = s.get(brain_api_url + "/simulations/" + child)
+                    alpha_id = child_progress.json()["alpha"]
+
+                    set_alpha_properties(s,
+                            alpha_id,
+                            name = "%s"%name,
+                            color = None,)
+                """
+            except KeyError:
+                print("look into: %s"%progress)
+            except Exception as e:
+                print(f"other error: {e}")
+
+
+        print("pool %d task %d simulate done"%(x, j))
+    
+    print("Simulate done")
+
+def generate_sim_data(alpha_list, region, uni, neut):
+    sim_data_list = []
+    for alpha, decay in alpha_list:
+        simulation_data = {
+            'type': 'REGULAR',
+            'settings': {
+                'instrumentType': 'EQUITY',
+                'region': region,
+                'universe': uni,
+                'delay': 1,
+                'decay': decay,
+                'neutralization': neut,
+                'truncation': 0.08,
+                'pasteurization': 'ON',
+                'testPeriod': 'P0Y',
+                'unitHandling': 'VERIFY',
+                'nanHandling': 'ON',
+                'language': 'FASTEXPR',
+                'visualization': False,
+            },
+            'regular': alpha}
+
+        sim_data_list.append(simulation_data)
+    return sim_data_list
+
+def set_alpha_properties(
+    s,
+    alpha_id,
+    name: str = None,
+    color: str = None,
+    selection_desc: str = "None",
+    combo_desc: str = "None",
+    tags: str = ["ace_tag"],
+):
+    """
+    Function changes alpha's description parameters
+    """
+ 
+    params = {
+        "color": color,
+        "name": name,
+        "tags": tags,
+        "category": None,
+        "regular": {"description": None},
+        "combo": {"description": combo_desc},
+        "selection": {"description": selection_desc},
+    }
+    response = s.patch(
+        "https://api.worldquantbrain.com/alphas/" + alpha_id, json=params
+    )
+
+def get_alphas(start_date, end_date, sharpe_th, fitness_th, region, alpha_num, usage):
+    s = login()
+    output = []
+    # 3E large 3C less
+    count = 0
+    for i in range(0, alpha_num, 100):
+        print(i)
+        url_e = "https://api.worldquantbrain.com/users/self/alphas?limit=100&offset=%d"%(i) \
+                + "&status=UNSUBMITTED%1FIS_FAIL&dateCreated%3E=2025-" + start_date  \
+                + "T00:00:00-04:00&dateCreated%3C2025-" + end_date \
+                + "T00:00:00-04:00&is.fitness%3E" + str(fitness_th) + "&is.sharpe%3E" \
+                + str(sharpe_th) + "&settings.region=" + region + "&order=-is.sharpe&hidden=false&type!=SUPER"
+        url_c = "https://api.worldquantbrain.com/users/self/alphas?limit=100&offset=%d"%(i) \
+                + "&status=UNSUBMITTED%1FIS_FAIL&dateCreated%3E=2025-" + start_date  \
+                + "T00:00:00-04:00&dateCreated%3C2025-" + end_date \
+                + "T00:00:00-04:00&is.fitness%3C-" + str(fitness_th) + "&is.sharpe%3C-" \
+                + str(sharpe_th) + "&settings.region=" + region + "&order=is.sharpe&hidden=false&type!=SUPER"
+        urls = [url_e]
+        if usage != "submit":
+            urls.append(url_c)
+        for url in urls:
+            response = s.get(url)
+            #print(response.json())
+            try:
+                alpha_list = response.json()["results"]
+                #print(response.json())
+                for j in range(len(alpha_list)):
+                    alpha_id = alpha_list[j]["id"]
+                    name = alpha_list[j]["name"]
+                    dateCreated = alpha_list[j]["dateCreated"]
+                    sharpe = alpha_list[j]["is"]["sharpe"]
+                    fitness = alpha_list[j]["is"]["fitness"]
+                    turnover = alpha_list[j]["is"]["turnover"]
+                    margin = alpha_list[j]["is"]["margin"]
+                    longCount = alpha_list[j]["is"]["longCount"]
+                    shortCount = alpha_list[j]["is"]["shortCount"]
+                    decay = alpha_list[j]["settings"]["decay"]
+                    exp = alpha_list[j]['regular']['code']
+                    count += 1
+                    #if (sharpe > 1.2 and sharpe < 1.6) or (sharpe < -1.2 and sharpe > -1.6):
+                    if (longCount + shortCount) > 100:
+                        if sharpe < -sharpe_th:
+                            exp = "-%s"%exp
+                        rec = [alpha_id, exp, sharpe, turnover, fitness, margin, dateCreated, decay]
+                        print(rec)
+                        if turnover > 0.7:
+                            rec.append(decay*4)
+                        elif turnover > 0.6:
+                            rec.append(decay*3+3)
+                        elif turnover > 0.5:
+                            rec.append(decay*3)
+                        elif turnover > 0.4:
+                            rec.append(decay*2)
+                        elif turnover > 0.35:
+                            rec.append(decay+4)
+                        elif turnover > 0.3:
+                            rec.append(decay+2)
+                        output.append(rec)
+            except:
+                print("%d finished re-login"%i)
+                s = login()
+
+    print("count: %d"%count)
+    return output, s  # 新增返回会话s
+
+def prune(next_alpha_recs, prefix, keep_num):
+    # prefix is the datafield prefix, fnd6, mdl175 ...
+    # keep_num is the num of top sharpe same-datafield alpha
+    output = []
+    num_dict = defaultdict(int)
+    for rec in next_alpha_recs:
+        exp = rec[1]
+        field = exp.split(prefix)[-1].split(",")[0]
+        sharpe = rec[2]
+        if sharpe < 0:
+            field = "-%s"%field
+        if num_dict[field] < keep_num:
+            num_dict[field] += 1
+            decay = rec[-1]
+            exp = rec[1]
+            output.append([exp,decay])
+    return output
+
+def get_group_second_order_factory(first_order, group_ops, region):
+    second_order = []
+    for fo in first_order:
+        for group_op in group_ops:
+            second_order += group_factory(group_op, fo, region)
+    return second_order
+
+
+def group_factory(op, field, region):
+    output = []
+    vectors = ["cap"] 
+    
+    chn_group_13 = ['pv13_h_min2_sector', 'pv13_di_6l', 'pv13_rcsed_6l', 'pv13_di_5l', 'pv13_di_4l', 
+                        'pv13_di_3l', 'pv13_di_2l', 'pv13_di_1l', 'pv13_parent', 'pv13_level']
+    
+    
+    chn_group_1 = ['sta1_top3000c30','sta1_top3000c20','sta1_top3000c10','sta1_top3000c2','sta1_top3000c5']
+    
+    chn_group_2 = ['sta2_top3000_fact4_c10','sta2_top2000_fact4_c50','sta2_top3000_fact3_c20']
+    
+    hkg_group_13 = ['pv13_10_f3_g2_minvol_1m_sector', 'pv13_10_minvol_1m_sector', 'pv13_20_minvol_1m_sector', 
+                    'pv13_2_minvol_1m_sector', 'pv13_5_minvol_1m_sector', 'pv13_1l_scibr', 'pv13_3l_scibr',
+                    'pv13_2l_scibr', 'pv13_4l_scibr', 'pv13_5l_scibr']
+    
+    hkg_group_1 = ['sta1_allc50','sta1_allc5','sta1_allxjp_513_c20','sta1_top2000xjp_513_c5']
+    
+    hkg_group_2 = ['sta2_all_xjp_513_all_fact4_c10','sta2_top2000_xjp_513_top2000_fact3_c10',
+                   'sta2_allfactor_xjp_513_13','sta2_top2000_xjp_513_top2000_fact3_c20']
+    
+    twn_group_13 = ['pv13_2_minvol_1m_sector','pv13_20_minvol_1m_sector','pv13_10_minvol_1m_sector',
+                    'pv13_5_minvol_1m_sector','pv13_10_f3_g2_minvol_1m_sector','pv13_5_f3_g2_minvol_1m_sector',
+                    'pv13_2_f4_g3_minvol_1m_sector']
+    
+    twn_group_1 = ['sta1_allc50','sta1_allxjp_513_c50','sta1_allxjp_513_c20','sta1_allxjp_513_c2',
+                   'sta1_allc20','sta1_allxjp_513_c5','sta1_allxjp_513_c10','sta1_allc2','sta1_allc5']
+    
+    twn_group_2 = ['sta2_allfactor_xjp_513_0','sta2_all_xjp_513_all_fact3_c20',
+                   'sta2_all_xjp_513_all_fact4_c20','sta2_all_xjp_513_all_fact4_c50']
+    
+    usa_group_13 = ['pv13_h_min2_3000_sector','pv13_r2_min20_3000_sector','pv13_r2_min2_3000_sector',
+                    'pv13_r2_min2_3000_sector', 'pv13_h_min2_focused_pureplay_3000_sector']
+    
+    usa_group_1 = ['sta1_top3000c50','sta1_allc20','sta1_allc10','sta1_top3000c20','sta1_allc5']
+    
+    usa_group_2 = ['sta2_top3000_fact3_c50','sta2_top3000_fact4_c20','sta2_top3000_fact4_c10']
+    
+    usa_group_6 = ['mdl10_group_name']
+    
+    asi_group_13 = ['pv13_20_minvol_1m_sector', 'pv13_5_f3_g2_minvol_1m_sector', 'pv13_10_f3_g2_minvol_1m_sector',
+                    'pv13_2_f4_g3_minvol_1m_sector', 'pv13_10_minvol_1m_sector', 'pv13_5_minvol_1m_sector']
+    
+    asi_group_1 = ['sta1_allc50', 'sta1_allc10', 'sta1_minvol1mc50','sta1_minvol1mc20',
+                   'sta1_minvol1m_normc20', 'sta1_minvol1m_normc50']
+    
+    jpn_group_1 = ['sta1_alljpn_513_c5', 'sta1_alljpn_513_c50', 'sta1_alljpn_513_c2', 'sta1_alljpn_513_c20']
+    
+    jpn_group_2 = ['sta2_top2000_jpn_513_top2000_fact3_c20', 'sta2_all_jpn_513_all_fact1_c5',
+                   'sta2_allfactor_jpn_513_9', 'sta2_all_jpn_513_all_fact1_c10']
+    
+    jpn_group_13 = ['pv13_2_minvol_1m_sector', 'pv13_2_f4_g3_minvol_1m_sector', 'pv13_10_minvol_1m_sector',
+                    'pv13_10_f3_g2_minvol_1m_sector', 'pv13_all_delay_1_parent', 'pv13_all_delay_1_level']
+    
+    kor_group_13 = ['pv13_10_f3_g2_minvol_1m_sector', 'pv13_5_minvol_1m_sector', 'pv13_5_f3_g2_minvol_1m_sector',
+                    'pv13_2_minvol_1m_sector', 'pv13_20_minvol_1m_sector', 'pv13_2_f4_g3_minvol_1m_sector']
+    
+    kor_group_1 = ['sta1_allc20','sta1_allc50','sta1_allc2','sta1_allc10','sta1_minvol1mc50',
+                   'sta1_allxjp_513_c10', 'sta1_top2000xjp_513_c50']
+    
+    kor_group_2 =['sta2_all_xjp_513_all_fact1_c50','sta2_top2000_xjp_513_top2000_fact2_c50',
+                  'sta2_all_xjp_513_all_fact4_c50','sta2_all_xjp_513_all_fact4_c5']
+    
+    eur_group_13 = ['pv13_5_sector', 'pv13_2_sector', 'pv13_v3_3l_scibr', 'pv13_v3_2l_scibr', 'pv13_2l_scibr',
+                    'pv13_52_sector', 'pv13_v3_6l_scibr', 'pv13_v3_4l_scibr', 'pv13_v3_1l_scibr']
+    
+    eur_group_1 = ['sta1_allc10', 'sta1_allc2', 'sta1_top1200c2', 'sta1_allc20', 'sta1_top1200c10']
+    
+    eur_group_2 = ['sta2_top1200_fact3_c50','sta2_top1200_fact3_c20','sta2_top1200_fact4_c50']
+    
+    glb_group_13 = ["pv13_10_f2_g3_sector", "pv13_2_f3_g2_sector", "pv13_2_sector", "pv13_52_all_delay_1_sector"]
+        
+    glb_group_1 = ['sta1_allc20', 'sta1_allc10', 'sta1_allc50', 'sta1_allc5']
+    
+    glb_group_2 = ['sta2_all_fact4_c50', 'sta2_all_fact4_c20', 'sta2_all_fact3_c20', 'sta2_all_fact4_c10']
+    
+    glb_group_13 = ['pv13_2_sector', 'pv13_10_sector', 'pv13_3l_scibr', 'pv13_2l_scibr', 'pv13_1l_scibr',
+                    'pv13_52_minvol_1m_all_delay_1_sector','pv13_52_minvol_1m_sector','pv13_52_minvol_1m_sector'] 
+    
+    amr_group_13 = ['pv13_4l_scibr', 'pv13_1l_scibr', 'pv13_hierarchy_min51_f1_sector',
+                    'pv13_hierarchy_min2_600_sector', 'pv13_r2_min2_sector', 'pv13_h_min20_600_sector']
+    
+    #bps_group = "bucket(rank(fnd28_value_05480), range='0.1, 1, 0.1')"
+    #pb_group = "bucket(rank(close/fnd28_value_05480), range='0.1, 1, 0.1')"
+    cap_group = "bucket(rank(cap), range='0.1, 1, 0.1')"
+    asset_group = "bucket(rank(assets),range='0.1, 1, 0.1')"
+    sector_cap_group = "bucket(group_rank(cap, sector),range='0.1, 1, 0.1')"
+    sector_asset_group = "bucket(group_rank(assets, sector),range='0.1, 1, 0.1')"
+
+    vol_group = "bucket(rank(ts_std_dev(returns,20)),range = '0.1, 1, 0.1')"
+
+    liquidity_group = "bucket(rank(close*volume),range = '0.1, 1, 0.1')"
+
+    groups = ["market","sector", "industry", "subindustry",
+            cap_group, asset_group, sector_cap_group, sector_asset_group, vol_group, liquidity_group]
+
+    if region == "CHN":
+        groups += chn_group_13 + chn_group_1 + chn_group_2  
+    if region == "TWN":
+        groups += twn_group_13 + twn_group_1 + twn_group_2 
+    if region == "ASI":
+        groups += asi_group_13 + asi_group_1 
+    if region == "USA":
+        groups += usa_group_13 + usa_group_1 + usa_group_2  
+    if region == "HKG":
+        groups += hkg_group_13 + hkg_group_1 + hkg_group_2 
+    if region == "KOR":
+        groups += kor_group_13 + kor_group_1 + kor_group_2 
+    if region == "EUR": 
+        groups += eur_group_13 + eur_group_1 + eur_group_2 
+    if region == "GLB":
+        groups += glb_group_13 + glb_group_1 + glb_group_2
+    if region == "AMR":
+        groups += amr_group_13 
+    if region == "JPN":
+        groups += jpn_group_1 + jpn_group_2 + jpn_group_13 
+        
+    for group in groups:
+        if op.startswith("group_vector"):
+            for vector in vectors:
+                alpha = "%s(%s,%s,densify(%s))"%(op, field, vector, group)
+                output.append(alpha)
+        elif op.startswith("group_percentage"):
+            alpha = "%s(%s,densify(%s),percentage=0.5)"%(op, field, group)
+            output.append(alpha)
+        else:
+            alpha = "%s(%s,densify(%s))"%(op, field, group)
+            output.append(alpha)
+        
+    return output
+
+
+def trade_when_factory(op,field,region):
+    output = []
+    open_events = ["ts_arg_max(volume, 5) == 0", "ts_corr(close, volume, 20) < 0",
+                   "ts_corr(close, volume, 5) < 0", "ts_mean(volume,10)>ts_mean(volume,60)",
+                   "group_rank(ts_std_dev(returns,60), sector) > 0.7", "ts_zscore(returns,60) > 2",
+                   "ts_arg_min(volume, 5) > 3",
+                   "ts_std_dev(returns, 5) > ts_std_dev(returns, 20)",
+                   "ts_arg_max(close, 5) == 0", "ts_arg_max(close, 20) == 0",
+                   "ts_corr(close, volume, 5) > 0", "ts_corr(close, volume, 5) > 0.3", "ts_corr(close, volume, 5) > 0.5",
+                   "ts_corr(close, volume, 20) > 0", "ts_corr(close, volume, 20) > 0.3", "ts_corr(close, volume, 20) > 0.5",
+                   "ts_regression(returns, %s, 5, lag = 0, rettype = 2) > 0"%field,
+                   "ts_regression(returns, %s, 20, lag = 0, rettype = 2) > 0"%field,
+                   "ts_regression(returns, ts_step(20), 20, lag = 0, rettype = 2) > 0",
+                   "ts_regression(returns, ts_step(5), 5, lag = 0, rettype = 2) > 0"]
+
+    exit_events = ["abs(returns) > 0.1", "-1"]
+
+    usa_events = ["rank(rp_css_business) > 0.8", "ts_rank(rp_css_business, 22) > 0.8", "rank(vec_avg(mws82_sentiment)) > 0.8",
+                  "ts_rank(vec_avg(mws82_sentiment),22) > 0.8", "rank(vec_avg(nws48_ssc)) > 0.8",
+                  "ts_rank(vec_avg(nws48_ssc),22) > 0.8", "rank(vec_avg(mws50_ssc)) > 0.8", "ts_rank(vec_avg(mws50_ssc),22) > 0.8",
+                  "ts_rank(vec_sum(scl12_alltype_buzzvec),22) > 0.9", "pcr_oi_270 < 1", "pcr_oi_270 > 1",]
+
+    asi_events = ["rank(vec_avg(mws38_score)) > 0.8", "ts_rank(vec_avg(mws38_score),22) > 0.8"]
+
+    eur_events = ["rank(rp_css_business) > 0.8", "ts_rank(rp_css_business, 22) > 0.8",
+                  "rank(vec_avg(oth429_research_reports_fundamental_keywords_4_method_2_pos)) > 0.8",
+                  "ts_rank(vec_avg(oth429_research_reports_fundamental_keywords_4_method_2_pos),22) > 0.8",
+                  "rank(vec_avg(mws84_sentiment)) > 0.8", "ts_rank(vec_avg(mws84_sentiment),22) > 0.8",
+                  "rank(vec_avg(mws85_sentiment)) > 0.8", "ts_rank(vec_avg(mws85_sentiment),22) > 0.8",
+                  "rank(mdl110_analyst_sentiment) > 0.8", "ts_rank(mdl110_analyst_sentiment, 22) > 0.8",
+                  "rank(vec_avg(nws3_scores_posnormscr)) > 0.8",
+                  "ts_rank(vec_avg(nws3_scores_posnormscr),22) > 0.8",
+                  "rank(vec_avg(mws36_sentiment_words_positive)) > 0.8",
+                  "ts_rank(vec_avg(mws36_sentiment_words_positive),22) > 0.8"]
+
+    glb_events = ["rank(vec_avg(mdl109_news_sent_1m)) > 0.8",
+                  "ts_rank(vec_avg(mdl109_news_sent_1m),22) > 0.8",
+                  "rank(vec_avg(nws20_ssc)) > 0.8",
+                  "ts_rank(vec_avg(nws20_ssc),22) > 0.8",
+                  "vec_avg(nws20_ssc) > 0",
+                  "rank(vec_avg(nws20_bee)) > 0.8",
+                  "ts_rank(vec_avg(nws20_bee),22) > 0.8",
+                  "rank(vec_avg(nws20_qmb)) > 0.8",
+                  "ts_rank(vec_avg(nws20_qmb),22) > 0.8"]
+
+    chn_events = ["rank(vec_avg(oth111_xueqiunaturaldaybasicdivisionstat_senti_conform)) > 0.8",
+                  "ts_rank(vec_avg(oth111_xueqiunaturaldaybasicdivisionstat_senti_conform),22) > 0.8",
+                  "rank(vec_avg(oth111_gubanaturaldaydevicedivisionstat_senti_conform)) > 0.8",
+                  "ts_rank(vec_avg(oth111_gubanaturaldaydevicedivisionstat_senti_conform),22) > 0.8",
+                  "rank(vec_avg(oth111_baragedivisionstat_regi_senti_conform)) > 0.8",
+                  "ts_rank(vec_avg(oth111_baragedivisionstat_regi_senti_conform),22) > 0.8"]
+
+    kor_events = ["rank(vec_avg(mdl110_analyst_sentiment)) > 0.8",
+                  "ts_rank(vec_avg(mdl110_analyst_sentiment),22) > 0.8",
+                  "rank(vec_avg(mws38_score)) > 0.8",
+                  "ts_rank(vec_avg(mws38_score),22) > 0.8"]
+
+    twn_events = ["rank(vec_avg(mdl109_news_sent_1m)) > 0.8",
+                  "ts_rank(vec_avg(mdl109_news_sent_1m),22) > 0.8",
+                  "rank(rp_ess_business) > 0.8",
+                  "ts_rank(rp_ess_business,22) > 0.8"]
+
+    for oe in open_events:
+        for ee in exit_events:
+            alpha = "%s(%s, %s, %s)"%(op, oe, field, ee)
+            output.append(alpha)
+    return output
+
+
+def check_submission(alpha_bag, gold_bag, start):
+    depot = []
+    s = login()
+    for idx, g in enumerate(alpha_bag):
+        if idx < start:
+            continue
+        if idx % 5 == 0:
+            print(idx)
+        if idx % 200 == 0:
+            s = login()
+        #print(idx)
+        pc = get_check_submission(s, g)
+        if pc == "sleep":
+            sleep(100)
+            s = login()
+            alpha_bag.append(g)
+        elif pc != pc:
+            # pc is nan
+            print("check self-corrlation error")
+            sleep(100)
+            alpha_bag.append(g)
+        elif pc == "fail":
+            continue
+        elif pc == "error":
+            depot.append(g)
+        else:
+            print(g)
+            gold_bag.append((g, pc))
+    print(depot)
+    return gold_bag
+
+def get_check_submission(s, alpha_id):
+    while True:
+        result = s.get("https://api.worldquantbrain.com/alphas/" + alpha_id + "/check")
+        if "retry-after" in result.headers:
+            time.sleep(float(result.headers["Retry-After"]))
+        else:
+            break
+    try:
+        if result.json().get("is", 0) == 0:
+            print("logged out")
+            return "sleep"
+        checks_df = pd.DataFrame(
+                result.json()["is"]["checks"]
+        )
+        pc = checks_df[checks_df.name == "PROD_CORRELATION"]["value"].values[0]
+        if not any(checks_df["result"] == "FAIL"):
+            return pc
+        else:
+            return "fail"
+    except:
+        print("catch: %s"%(alpha_id))
+        return "error"
+    
+
+def view_alphas(gold_bag):
+    s = login()
+    sharp_list = []
+    for gold, pc in gold_bag:
+
+        triple = locate_alpha(s, gold)
+        info = [triple[0], triple[2], triple[3], triple[4], triple[5], triple[6], triple[1]]
+        info.append(pc)
+        sharp_list.append(info)
+
+    sharp_list.sort(reverse=True, key = lambda x : x[1])
+    for i in sharp_list:
+        print(i)
+ 
+def locate_alpha(s, alpha_id):
+    while True:
+        alpha = s.get("https://api.worldquantbrain.com/alphas/" + alpha_id)
+        if "retry-after" in alpha.headers:
+            time.sleep(float(alpha.headers["Retry-After"]))
+        else:
+            break
+    string = alpha.content.decode('utf-8')
+    metrics = json.loads(string)
+    #print(metrics["regular"]["code"])
+    
+    dateCreated = metrics["dateCreated"]
+    sharpe = metrics["is"]["sharpe"]
+    fitness = metrics["is"]["fitness"]
+    turnover = metrics["is"]["turnover"]
+    margin = metrics["is"]["margin"]
+    decay = metrics["settings"]["decay"]
+    exp = metrics['regular']['code']
+    
+    triple = [alpha_id, exp, sharpe, turnover, fitness, margin, dateCreated, decay]
+    return triple
+
+
+
+# some factory for other operators 
+def vector_factory(op, field):
+    output = []
+    vectors = ["cap"]
+    
+    for vector in vectors:
+    
+        alpha = "%s(%s, %s)"%(op, field, vector)
+        output.append(alpha)
+    
+    return output
+ 
+ 
+def ts_comp_factory(op, field, factor, paras):
+    output = []
+    #l1, l2 = [3, 5, 10, 20, 60, 120, 240], paras
+    l1, l2 = [5, 22, 66, 240], paras
+    comb = list(product(l1, l2))
+    
+    for day,para in comb:
+        
+        if type(para) == float:
+            alpha = "%s(%s, %d, %s=%.1f)"%(op, field, day, factor, para)
+        elif type(para) == int:
+            alpha = "%s(%s, %d, %s=%d)"%(op, field, day, factor, para)
+            
+        output.append(alpha)
+    
+    return output
+ 
+def twin_field_factory(op, field, fields):
+    
+    output = []
+    #days = [3, 5, 10, 20, 60, 120, 240]
+    days = [5, 22, 66, 240]
+    outset = list(set(fields) - set([field]))
+    
+    for day in days:
+        for counterpart in outset:
+            alpha = "%s(%s, %s, %d)"%(op, field, counterpart, day)
+            output.append(alpha)
+    
+    return output
+ 
+def login_hk():
+    
+    username = ""
+    password = ""
+    
+    # Create a session to persistently store the headers
+    s = requests.Session()
+    
+    # Save credentials into session
+    s.auth = (username, password)
+    
+    # Send a POST request to the /authentication API
+    response = s.post('https://api.worldquantbrain.com/authentication')
+    
+    if response.status_code == requests.codes.unauthorized:
+        # Check if biometrics is required
+        if response.headers.get("WWW-Authenticate") == "persona":
+            print(
+                "Complete biometrics authentication by scanning your face. Follow the link: \n"
+                + urljoin(response.url, response.headers["Location"]) + "\n"
+            )
+            input("Press any key after you complete the biometrics authentication.")
+            
+            # Retry the authentication after biometrics
+            biometrics_response = s.post(urljoin(response.url, response.headers["Location"]))
+            
+            while biometrics_response.status_code != 201:
+                input("Biometrics authentication is not complete. Please try again and press any key when completed.")
+                biometrics_response = s.post(urljoin(response.url, response.headers["Location"]))
+                
+            print("Biometrics authentication completed.")
+        else:
+            print("\nIncorrect username or password. Please check your credentials.\n")
+    else:
+        print("Logged in successfully.")
+    
+    return s 
--- a/alpha_check/main.go
+++ b/alpha_check/main.go
@ -0,0 +1,477 @@
+package main
+
+import (
+	"encoding/base64"
+	"encoding/json"
+	"fmt"
+	"math"
+	"strconv"
+	"strings"
+	"time"
+
+	"github.com/valyala/fasthttp"
+)
+
+const (
+	baseURL           = "https://api.worldquantbrain.com"
+	zeroStreakThreshold = 5 * 252
+	requiredDays      = 2920
+)
+
+type Client struct {
+	client   *fasthttp.Client
+	username string
+	password string
+}
+
+type AlphaRecord struct {
+	ID           string  `json:"id"`
+	Name         string  `json:"name"`
+	DateCreated  string  `json:"dateCreated"`
+	Sharpe       float64 `json:"sharpe"`
+	Fitness      float64 `json:"fitness"`
+	Turnover     float64 `json:"turnover"`
+	Margin       float64 `json:"margin"`
+	LongCount    float64 `json:"longCount"`
+	ShortCount   float64 `json:"shortCount"`
+	Decay        int     `json:"decay"`
+	Code         string  `json:"code"`
+}
+
+type AlphaResponse struct {
+	Results []struct {
+		ID          string                 `json:"id"`
+		Name        string                 `json:"name"`
+		DateCreated string                 `json:"dateCreated"`
+		Is          map[string]interface{} `json:"is"`
+		Settings    struct {
+			Decay int `json:"decay"`
+		} `json:"settings"`
+		Regular struct {
+			Code string `json:"code"`
+		} `json:"regular"`
+	} `json:"results"`
+}
+
+type PnlResponse struct {
+	Records [][]interface{} `json:"records"`
+}
+
+func NewClient(username, password string) *Client {
+	return &Client{
+		client:   &fasthttp.Client{},
+		username: username,
+		password: password,
+	}
+}
+
+func (c *Client) getAuthHeader() string {
+	auth := base64.StdEncoding.EncodeToString([]byte(c.username + ":" + c.password))
+	return "Basic " + auth
+}
+
+func (c *Client) Login() error {
+	req := fasthttp.AcquireRequest()
+	resp := fasthttp.AcquireResponse()
+	defer fasthttp.ReleaseRequest(req)
+	defer fasthttp.ReleaseResponse(resp)
+
+	req.SetRequestURI(baseURL + "/authentication")
+	req.Header.SetMethod("POST")
+	req.Header.Set("Authorization", c.getAuthHeader())
+
+	err := c.client.Do(req, resp)
+	if err != nil {
+		return err
+	}
+
+	fmt.Println(string(resp.Body()))
+	return nil
+}
+
+func (c *Client) WaitGet(url string, maxRetries int) (*fasthttp.Response, error) {
+	retries := 0
+	for retries < maxRetries {
+		for {
+			req := fasthttp.AcquireRequest()
+			resp := fasthttp.AcquireResponse()
+			req.SetRequestURI(url)
+			req.Header.SetMethod("GET")
+			req.Header.Set("Authorization", c.getAuthHeader())
+
+			err := c.client.Do(req, resp)
+			if err != nil {
+				fasthttp.ReleaseRequest(req)
+				fasthttp.ReleaseResponse(resp)
+				return nil, err
+			}
+
+			retryAfter := resp.Header.Peek("Retry-After")
+			if len(retryAfter) == 0 {
+				fasthttp.ReleaseRequest(req)
+				if resp.StatusCode() < 400 {
+					return resp, nil
+				}
+				fasthttp.ReleaseResponse(resp)
+				break
+			}
+
+			sleepSec, _ := strconv.ParseFloat(string(retryAfter), 64)
+			time.Sleep(time.Duration(sleepSec) * time.Second)
+			fasthttp.ReleaseRequest(req)
+			fasthttp.ReleaseResponse(resp)
+		}
+
+		time.Sleep(time.Duration(math.Pow(2, float64(retries))) * time.Second)
+		retries++
+	}
+
+	return nil, fmt.Errorf("max retries exceeded")
+}
+
+func (c *Client) Get(url string) (*fasthttp.Response, error) {
+	req := fasthttp.AcquireRequest()
+	resp := fasthttp.AcquireResponse()
+	req.SetRequestURI(url)
+	req.Header.SetMethod("GET")
+	req.Header.Set("Authorization", c.getAuthHeader())
+
+	err := c.client.Do(req, resp)
+	if err != nil {
+		fasthttp.ReleaseRequest(req)
+		fasthttp.ReleaseResponse(resp)
+		return nil, err
+	}
+
+	return resp, nil
+}
+
+func (c *Client) Patch(url string, data map[string]interface{}) (*fasthttp.Response, error) {
+	req := fasthttp.AcquireRequest()
+	resp := fasthttp.AcquireResponse()
+	defer fasthttp.ReleaseRequest(req)
+
+	req.SetRequestURI(url)
+	req.Header.SetMethod("PATCH")
+	req.Header.Set("Authorization", c.getAuthHeader())
+	req.Header.SetContentType("application/json")
+
+	jsonData, _ := json.Marshal(data)
+	req.SetBody(jsonData)
+
+	err := c.client.Do(req, resp)
+	if err != nil {
+		fasthttp.ReleaseResponse(resp)
+		return nil, err
+	}
+
+	return resp, nil
+}
+
+func GetAlphas(c *Client, startDate, endDate string, sharpeTh, fitnessTh float64, region string, alphaNum int, usage string) ([][]interface{}, *Client, error) {
+	output := make([][]interface{}, 0)
+	count := 0
+
+	for i := 0; i < alphaNum; i += 100 {
+		fmt.Println(i)
+
+		urlE := fmt.Sprintf("%s/users/self/alphas?limit=100&offset=%d&status=UNSUBMITTED%%1FIS_FAIL&dateCreated%%3E=2025-%sT00:00:00-04:00&dateCreated%%3C2025-%sT00:00:00-04:00&is.fitness%%3E%f&is.sharpe%%3E%f&settings.region=%s&order=-is.sharpe&hidden=false&type!=SUPER",
+			baseURL, i, startDate, endDate, fitnessTh, sharpeTh, region)
+
+		urlC := fmt.Sprintf("%s/users/self/alphas?limit=100&offset=%d&status=UNSUBMITTED%%1FIS_FAIL&dateCreated%%3E=2025-%sT00:00:00-04:00&dateCreated%%3C2025-%sT00:00:00-04:00&is.fitness%%3C-%f&is.sharpe%%3C-%f&settings.region=%s&order=is.sharpe&hidden=false&type!=SUPER",
+			baseURL, i, startDate, endDate, fitnessTh, sharpeTh, region)
+
+		urls := []string{urlE}
+		if usage != "submit" {
+			urls = append(urls, urlC)
+		}
+
+		for _, url := range urls {
+			resp, err := c.Get(url)
+			if err != nil {
+				fmt.Printf("%d finished re-login\n", i)
+				c.Login()
+				continue
+			}
+
+			var alphaResp AlphaResponse
+			if err := json.Unmarshal(resp.Body(), &alphaResp); err != nil {
+				fasthttp.ReleaseResponse(resp)
+				fmt.Printf("%d finished re-login\n", i)
+				c.Login()
+				continue
+			}
+			fasthttp.ReleaseResponse(resp)
+
+			for _, item := range alphaResp.Results {
+				alphaID := item.ID
+				name := item.Name
+				dateCreated := item.DateCreated
+				sharpe := getFloat(item.Is, "sharpe")
+				fitness := getFloat(item.Is, "fitness")
+				turnover := getFloat(item.Is, "turnover")
+				margin := getFloat(item.Is, "margin")
+				longCount := getFloat(item.Is, "longCount")
+				shortCount := getFloat(item.Is, "shortCount")
+				decay := item.Settings.Decay
+				exp := item.Regular.Code
+
+				count++
+
+				if (longCount + shortCount) > 100 {
+					if sharpe < -sharpeTh {
+						exp = "-" + exp
+					}
+
+					rec := []interface{}{alphaID, exp, sharpe, turnover, fitness, margin, dateCreated, decay}
+					fmt.Println(rec)
+
+					if turnover > 0.7 {
+						rec = append(rec, float64(decay)*4)
+					} else if turnover > 0.6 {
+						rec = append(rec, float64(decay)*3+3)
+					} else if turnover > 0.5 {
+						rec = append(rec, float64(decay)*3)
+					} else if turnover > 0.4 {
+						rec = append(rec, float64(decay)*2)
+					} else if turnover > 0.35 {
+						rec = append(rec, float64(decay)+4)
+					} else if turnover > 0.3 {
+						rec = append(rec, float64(decay)+2)
+					}
+
+					output = append(output, rec)
+				}
+			}
+		}
+	}
+
+	fmt.Printf("count: %d\n", count)
+	return output, c, nil
+}
+
+func getFloat(m map[string]interface{}, key string) float64 {
+	if v, ok := m[key]; ok {
+		switch val := v.(type) {
+		case float64:
+			return val
+		case int:
+			return float64(val)
+		}
+	}
+	return 0
+}
+
+func CheckConsecutiveNonZeroValues(alphaID string, data [][]interface{}, requiredStreak int) bool {
+	if len(data) < requiredStreak {
+		return true
+	}
+
+	checkColumn := func(columnData []float64) bool {
+		if len(columnData) < requiredStreak {
+			return true
+		}
+
+		currentStreakCount := 0
+		var currentStreakValue interface{}
+
+		for _, value := range columnData {
+			if value != 0 {
+				if currentStreakValue != nil && value == currentStreakValue {
+					currentStreakCount++
+				} else {
+					currentStreakValue = value
+					currentStreakCount = 1
+				}
+			} else {
+				currentStreakValue = nil
+				currentStreakCount = 0
+			}
+
+			if currentStreakCount >= requiredStreak {
+				return false
+			}
+		}
+		return true
+	}
+
+	var column1Values, column2Values []float64
+	for _, row := range data {
+		if len(row) >= 3 {
+			if v, ok := row[1].(float64); ok {
+				column1Values = append(column1Values, v)
+			}
+			if v, ok := row[2].(float64); ok {
+				column2Values = append(column2Values, v)
+			}
+		}
+	}
+
+	if len(column1Values) > 0 && len(column2Values) > 0 {
+		isCol1AllZeros := allZeros(column1Values)
+		isCol2AllZeros := allZeros(column2Values)
+		if isCol1AllZeros || isCol2AllZeros {
+			fmt.Println(alphaID, "不合法")
+			return false
+		}
+	}
+
+	if !checkColumn(column1Values) {
+		fmt.Println(alphaID, "不合法")
+		return false
+	}
+
+	if !checkColumn(column2Values) {
+		fmt.Println(alphaID, "不合法")
+		return false
+	}
+
+	return true
+}
+
+func allZeros(arr []float64) bool {
+	for _, v := range arr {
+		if v != 0 {
+			return false
+		}
+	}
+	return true
+}
+
+func GetAlphaPnlLegal(c *Client, alphaID string) bool {
+	notLegalID := make([]string, 0)
+
+	url := baseURL + "/alphas/" + alphaID + "/recordsets/pnl"
+	resp, err := c.WaitGet(url, 10)
+	if err != nil {
+		return false
+	}
+	defer fasthttp.ReleaseResponse(resp)
+
+	var pnlResp PnlResponse
+	if err := json.Unmarshal(resp.Body(), &pnlResp); err != nil {
+		return false
+	}
+
+	records := pnlResp.Records
+	if len(records) == 0 {
+		return false
+	}
+
+	var dateList []time.Time
+	for _, record := range records {
+		if len(record) == 0 {
+			continue
+		}
+		dateStr, ok := record[0].(string)
+		if !ok {
+			return false
+		}
+		dateObj, err := time.Parse("2006-01-02", dateStr)
+		if err != nil {
+			return false
+		}
+		dateList = append(dateList, dateObj)
+	}
+
+	if len(dateList) == 0 {
+		return false
+	}
+
+	minDate := dateList[0]
+	maxDate := dateList[0]
+	for _, d := range dateList {
+		if d.Before(minDate) {
+			minDate = d
+		}
+		if d.After(maxDate) {
+			maxDate = d
+		}
+	}
+
+	totalDays := int(maxDate.Sub(minDate).Hours() / 24)
+	if totalDays < requiredDays {
+		return false
+	}
+
+	col1Zeros := make([]bool, 0)
+	for _, record := range records {
+		if len(record) >= 2 {
+			if v, ok := record[1].(float64); ok {
+				col1Zeros = append(col1Zeros, v == 0)
+			}
+		}
+	}
+
+	col1MaxZeroStreak := maxConsecutiveZeros(col1Zeros)
+
+	if col1MaxZeroStreak >= zeroStreakThreshold {
+		fmt.Printf("%s 不合法：存在连续%d年零值\n", alphaID, zeroStreakThreshold/252)
+		notLegalID = append(notLegalID, alphaID)
+		return false
+	}
+
+	if !CheckConsecutiveNonZeroValues(alphaID, records, 200) {
+		return false
+	}
+
+	_ = notLegalID
+	return true
+}
+
+func maxConsecutiveZeros(arr []bool) int {
+	maxStreak := 0
+	currentStreak := 0
+	for _, val := range arr {
+		if val {
+			currentStreak++
+			if currentStreak > maxStreak {
+				maxStreak = currentStreak
+			}
+		} else {
+			currentStreak = 0
+		}
+	}
+	return maxStreak
+}
+
+func Mute(c *Client, alphaID string) {
+	url := baseURL + "/alphas/" + alphaID
+	data := map[string]interface{}{
+		"hidden": true,
+	}
+	c.Patch(url, data)
+}
+
+func main() {
+	client := NewClient("", "")
+	client.Login()
+
+	foTracker, c, err := GetAlphas(client, "12-01", "12-31", 1, 0.5, "USA", 1000, "submit")
+	if err != nil {
+		fmt.Println("Error:", err)
+		return
+	}
+
+	fNum := len(foTracker)
+	fmt.Printf("%d 个alpha 进行pnl合法检测，请耐心等待\n", fNum)
+	fmt.Println(len(foTracker))
+
+	count := 0
+	for i := len(foTracker) - 1; i >= 0; i-- {
+		if count%25 == 0 {
+			fmt.Printf("=========== %d ===========\n", count)
+		}
+		count++
+
+		alphaID, ok := foTracker[i][0].(string)
+		if !ok {
+			continue
+		}
+
+		if !GetAlphaPnlLegal(c, alphaID) {
+			fmt.Println(alphaID, "已经隐藏")
+			Mute(c, alphaID)
+		}
+	}
+}
--- a/alpha_check/main.py
+++ b/alpha_check/main.py
@ -0,0 +1,223 @@
+import time
+import httpx
+import datetime
+
+
+def login():
+    username = "jack0210_@hotmail.com"
+    password = "!QAZ2wsx+0913"
+
+    timeout = httpx.Timeout(60.0, connect=10.0)
+    limits = httpx.Limits(max_keepalive_connections=20, max_connections=100)
+    transport = httpx.HTTPTransport(retries=3)
+
+    s = httpx.Client(
+        auth=(username, password),
+        timeout=timeout,
+        limits=limits,
+        transport=transport
+    )
+    response = s.post('https://api.worldquantbrain.com/authentication')
+    print(response.content)
+    return s
+
+
+def wait_get(s, url: str, max_retries: int = 10):
+    retries = 0
+    while retries < max_retries:
+        while True:
+            simulation_progress = s.get(url)
+            if simulation_progress.headers.get("Retry-After", 0) == 0:
+                break
+            time.sleep(float(simulation_progress.headers["Retry-After"]))
+        if simulation_progress.status_code < 400:
+            break
+        else:
+            time.sleep(2 ** retries)
+            retries += 1
+    return simulation_progress
+
+
+def get_alphas(start_date, end_date, sharpe_th, fitness_th, region, alpha_num, usage):
+    s = login()
+    output = []
+    count = 0
+    for i in range(0, alpha_num, 100):
+        print(i)
+        url_e = "https://api.worldquantbrain.com/users/self/alphas?limit=100&offset=%d" % (i) \
+                + "&status=UNSUBMITTED%1FIS_FAIL&dateCreated%3E=2025-" + start_date \
+                + "T00:00:00-04:00&dateCreated%3C2025-" + end_date \
+                + "T00:00:00-04:00&is.fitness%3E" + str(fitness_th) + "&is.sharpe%3E" \
+                + str(sharpe_th) + "&settings.region=" + region + "&order=-is.sharpe&hidden=false&type!=SUPER"
+        url_c = "https://api.worldquantbrain.com/users/self/alphas?limit=100&offset=%d" % (i) \
+                + "&status=UNSUBMITTED%1FIS_FAIL&dateCreated%3E=2025-" + start_date \
+                + "T00:00:00-04:00&dateCreated%3C2025-" + end_date \
+                + "T00:00:00-04:00&is.fitness%3C-" + str(fitness_th) + "&is.sharpe%3C-" \
+                + str(sharpe_th) + "&settings.region=" + region + "&order=is.sharpe&hidden=false&type!=SUPER"
+        urls = [url_e]
+        if usage != "submit":
+            urls.append(url_c)
+        for url in urls:
+            response = s.get(url)
+            try:
+                alpha_list = response.json()["results"]
+                for j in range(len(alpha_list)):
+                    alpha_id = alpha_list[j]["id"]
+                    name = alpha_list[j]["name"]
+                    dateCreated = alpha_list[j]["dateCreated"]
+                    sharpe = alpha_list[j]["is"]["sharpe"]
+                    fitness = alpha_list[j]["is"]["fitness"]
+                    turnover = alpha_list[j]["is"]["turnover"]
+                    margin = alpha_list[j]["is"]["margin"]
+                    longCount = alpha_list[j]["is"]["longCount"]
+                    shortCount = alpha_list[j]["is"]["shortCount"]
+                    decay = alpha_list[j]["settings"]["decay"]
+                    exp = alpha_list[j]['regular']['code']
+                    count += 1
+                    if (longCount + shortCount) > 100:
+                        if sharpe < -sharpe_th:
+                            exp = "-%s" % exp
+                        rec = [alpha_id, exp, sharpe, turnover, fitness, margin, dateCreated, decay]
+                        print(rec)
+                        if turnover > 0.7:
+                            rec.append(decay * 4)
+                        elif turnover > 0.6:
+                            rec.append(decay * 3 + 3)
+                        elif turnover > 0.5:
+                            rec.append(decay * 3)
+                        elif turnover > 0.4:
+                            rec.append(decay * 2)
+                        elif turnover > 0.35:
+                            rec.append(decay + 4)
+                        elif turnover > 0.3:
+                            rec.append(decay + 2)
+                        output.append(rec)
+            except:
+                print("%d finished re-login" % i)
+                s = login()
+
+    print("count: %d" % count)
+    return output, s
+
+
+def check_consecutive_non_zero_values(alpha_id, data, required_streak=200):
+    if not data or len(data) < required_streak:
+        return True
+
+    def check_column(column_data):
+        if len(column_data) < required_streak:
+            return True
+
+        current_streak_count = 0
+        current_streak_value = None
+
+        for value in column_data:
+            if value != 0:
+                if value == current_streak_value:
+                    current_streak_count += 1
+                else:
+                    current_streak_value = value
+                    current_streak_count = 1
+            else:
+                current_streak_value = None
+                current_streak_count = 0
+
+            if current_streak_count >= required_streak:
+                return False
+        return True
+
+    column1_values = []
+    column2_values = []
+    for row in data:
+        if len(row) >= 3:
+            column1_values.append(row[1])
+            column2_values.append(row[2])
+
+    if column1_values and column2_values:
+        is_col1_all_zeros = all(v == 0 for v in column1_values)
+        is_col2_all_zeros = all(v == 0 for v in column2_values)
+        if is_col1_all_zeros or is_col2_all_zeros:
+            print(alpha_id, "不合法")
+            return False
+
+    if not check_column(column1_values):
+        print(alpha_id, "不合法")
+        return False
+
+    if not check_column(column2_values):
+        print(alpha_id, "不合法")
+        return False
+
+    return True
+
+
+def get_alpha_pnl_legal(s, alpha_id: str) -> bool:
+    not_legal_id = []
+    pnl = wait_get(s, "https://api.worldquantbrain.com/alphas/" + alpha_id + "/recordsets/pnl").json()
+    records = pnl["records"]
+
+    if not records:
+        return False
+
+    date_list = []
+    for record in records:
+        try:
+            date_obj = datetime.datetime.strptime(record[0], '%Y-%m-%d').date()
+            date_list.append(date_obj)
+        except Exception:
+            return False
+
+    min_date = min(date_list)
+    max_date = max(date_list)
+    total_days = (max_date - min_date).days
+    if total_days < 2920:
+        return False
+
+    zero_streak_threshold = 5 * 252
+    col1_zeros = [record[1] == 0 for record in records]
+
+    def max_consecutive_zeros(arr):
+        max_streak = current_streak = 0
+        for val in arr:
+            current_streak = current_streak + 1 if val else 0
+            max_streak = max(max_streak, current_streak)
+        return max_streak
+
+    col1_max_zero_streak = max_consecutive_zeros(col1_zeros)
+
+    if col1_max_zero_streak >= zero_streak_threshold:
+        print(f"{alpha_id} 不合法：存在连续{zero_streak_threshold // 252}年零值")
+        not_legal_id.append(str(alpha_id))
+        return False
+
+    if not check_consecutive_non_zero_values(alpha_id, records):
+        return False
+
+    return True
+
+
+def mute(s, alpha_id):
+    url = "https://api.worldquantbrain.com/alphas/" + alpha_id
+    data = {
+        "hidden": True
+    }
+    response = s.patch(url, json=data)
+
+
+def main():
+    fo_tracker, s = get_alphas('12-01', '12-31', 1, 0.5, 'USA', 1000, 'submit')
+    f_num = len(fo_tracker)
+    print(f_num, "个alpha 进行pnl合法检测，请耐心等待")
+    count = 0
+    print(len(fo_tracker))
+    for i in fo_tracker[::-1][0:]:
+        if count % 25 == 0:
+            print('===========', count, '===========')
+        count += 1
+        if get_alpha_pnl_legal(s, i[0]) == False:
+            print(i[0], '已经隐藏')
+            mute(s, i[0])
+
+
+if __name__ == "__main__":
+    main()