| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224 |
- ;#################################################################
- ;# �������ļ����ִ�Сд����������/������һ�ɲ���Сд�ַ� #
- ;# ��������ģ�����á�postproc�� #
- ;#################################################################
- [postproc]
- ;�Ƿ�ر����ֹ������滻��������㴦��,˳���ͼ�ת����true/false��
- pproc_param_closeallproc=false
- ;�Ƿ����˳��������true/false��
- smoothproc=false
- ;�Ƿ���п������������true/false��
- colloqproc=false
- ;�Ƿ���б�㴦����true/false��
- puncproc=true
- ;�Ƿ�������ֹ�����true/false��
- numproc=true
- ;�Ƿ�����滻������true/false��
- replaceproc=false
- ;�Ƿ���зֶδ�����true/false��
- paragraproc = false
- ;�ӿ����͡�0 - תд��1 - ��д��
- interfacetype = 1
- ;�������Ƿ�Ϊ����ģʽ������ģʽʱ�������һ�������true/false������д�������ã�תдʱ������ʧЧ��
- puncCacheMoudle = true
- ;�������ԡ�0 - ���ģ�1 - ���2 - Ӣ�3 - ������[��Ӣ]��
- languagetype=0
- ;Quark�������Ĭ��ΪCnNet
- ;nextG������͡�0 - JSON��ʽ, 1 - ����(�ı���ʽ)��
- outputtype=0
- ;0:�����ԣ� 1����㣬 2��˳���� 3���ֶ�
- pproc_test=0
- ;�Ƿ���ض��㻯��Դ
- bilstm_fix = 1
- ;�Ƿ���ת��Ϊ����(ֻ����ͨ������������ʱ��Ч)��true/false��,Ĭ��Ϊfalse
- needJianToFan=false
- ;�Ƿ�رպ��������Ŷ������true/false��,Ĭ��Ϊfalse
- outCmInfo=true
- ;#�Ƿ���ݴ������Ż�˳���ͱ�㡾true/false��������Ĵʴ�������ʱ��������Ч��
- useAttribute=false
- ;#�Ƿ�����n��s��p��g������������ԡ�true/false����Ĭ��Ϊfalse
- reserveAllAttribute= false
- ;#################################################################
- ;# ���ִ������á�numproc�� #
- ;#################################################################
- [postproc\numproc]
- ;nlpģ��dll·��
- nlp_module_path= nlp.dll
- ;���ֹ���ʹ��c++:0 ���� python:1
- num_proc_type = 0
- ;���ֹ���������0:��ͨ������1:����������2:ҽ�Ƴ���
- num_usage_scene = 0
- ;nlp�����Դ
- semantic_word_dict=pproc/resource_2_0_12/SemanticWord.dic
- basic_phrase_gram=pproc/resource_2_0_12/BasicPhrase.gram
- number_dict=pproc/resource_2_0_12/number_math_normal.dic
- number_gram=pproc/resource_2_0_12/number_math_normal.gram
- not_replace_list=pproc/resource_2_0_12/num_not_change_list
- ;#��Ҫ��������������
- [postproc\numproc\proc_num_semantic]
- ;����=on/off
- NumStr=on
- NumSeq=on
- BigNum=on
- PersonalInformation=on
- Date=on
- Time=on
- Fraction=on
- LicensePlate=on
- NumberOverWan=on
- Delete=on
- MathSymbol=on
- SpecialWord=on
- WebSite=on
- NumstrUighur=on
- NumseqUighur=on
- MonthUighur=on
- NumsymbolUighur=on
- NumzeroUighur=on
- SpecialwordUighur=on
- SpecialnullUighur=on
- SpecialpointUighur=on
- CourtMeasure=on
- ;#��Ҫ�������������
- [postproc\numproc\output_num_semantic]
- ;����=on/off
- ;#################################################################
- ;# �滻�������á�replaceproc�� #
- ;#################################################################
- [postproc\replaceproc]
- ;�滻�б�
- replace_list=pproc/resource_2_0_12/replace_list
- ;�������滻����
- proc_tatata = false
- tatata_szBinResURL = pproc/resource_2_0_12/bin_model/BiLstm_tatata.bin
- ;#################################################################
- ;# ˳���������á�smoothproc�� #
- ;#################################################################
- [postproc\smoothproc]
- ;smooth blstm��������0-float��1-8bit��2-16bit��Ĭ��0
- smooth_calc_type = 1
- ;smooth ��Դ����0-��26ά������1-����26ά������Ĭ��0
- smooth_res_type = 0
- ;bilstm˳����Դ
- blstm_BinURL_smooth = pproc/resource_2_0_12/bin_model/BiLstm_smooth_model_20170919_smooth.bin
- blstm_BinURL_smooth_English = pproc/resource_2_0_12/bin_model/BiLstm_smooth_2layer_English_20171212_smooth.bin
- ;#################################################################
- ;# ��㴦�����á�puncproc�� #
- ;#################################################################
- [postproc\puncproc]
- ;punc��Դ����0-blstm��1-blstm_PD, 2-selfAttentionĬ��0
- punc_res_type = 1
- ;punc mlp��������0-float��1-8bit��2-16bit��Ĭ��0��blstmֻ֧��0��1��selfAttenֻ֧��0��2
- punc_calc_type = 1
- blstm_BinURL_punc = pproc/BiLstm_shengxue_offline_20210324_slni2_fixpunc.bin
- ###pproc/out_punc.bin
- ;8άwordembeding����BiLstm_punc_2018_1_8����ʹ�ã���ʹ��ʱ�轫��ע��
- blstm_BinURL_punc_PD = pproc/BiLstm_shengxue_offline_20210324_slni2_fixpunc.bin
- ##pproc/resource_2_0_12/bin_model/BiLstm_punc_tingjian_vad_tag_dunhao_20181115_punc.bin
- ;new punc model
- selfAtten_BinURL_punc = pproc/resource_2_0_12/bin_model/SelfAttention_20181106_punc.bin
- ;Ӣ��punc��Դ����0-blstm_eng��1-blstm_eng_PD, Ĭ��0
- punc_res_type_eng = 0
- blstm_BinURL_punc_English = pproc/resource_2_0_12/bin_model/BiLstm_punc_English.bin
- blstm_BinURL_punc_English_PD =
- ;�������ϵ����Ĭ��Ϊ0.0
- prior_rate = 0.2
- ###0
- ;Ӣ�ı������ϵ����Ĭ��Ϊ0.0
- prior_rate_en =
- ;��Ӣ������������ֵ
- prior_value = 0.85924767,0.062097898,0.068435067,0.000801522,0.009417843
- ####0.86126,0.06213,0.0668,0.00066,0.0091
- prior_value_en = 0.87,0.069,0.055,0.0002,0.0055
- ;Vad�������ޣ���Ԥ����Ϊ�������ʱ(maxΪ0)����������Ч��
- ;�����������趨max��second_max֮��IJ�ֵ����ֵ���ڴ����Ų��ӱ�㣬�����second_max���
- ;Ĭ��Ϊ0������������ʧЧ(Quark��վ�ͻ���ϵͳ����Ϊ0�����뷨ʱ��Ϊ0.9)
- vad_punc_threshold = 0
- ###0.8
- ;���о�����ޣ��������ƾ��г���ţ�
- ;�����о�ŵ÷�-���ŵ÷֣����ڴ�����ʱ�żӾ�ţ�����Ӷ���
- ;Ĭ��Ϊ0������������ʧЧ(Quark��վ�ͻ���ϵͳ����Ϊ0�����뷨ʱ��Ϊ7)
- period_punc_threshold = 0
- ;��ӡ���Ԥ������Ĭ��Ϊ0
- # print_punc_result = 0
- ;#################################################################
- ;# �ֶδ������á�paragraproc�� #
- ;#################################################################
- [postproc\paragraproc]
- ;onlinePara lstm��������0-float��1-8bit��Ĭ��0��(offlineʱ����Ч��ֻʹ��float����)
- para_calc_type = 1
- ;paragraph blstm��Դ
- blstm_BinURL_para = pproc/resource_2_0_12/bin_model/BiLstm_para_online_segment_20180611_para.bin
- ;��Ƶ���Ự���������Ƿ�ǿ�ƷֶΣ�Ĭ��Ϊfalse
- force_do_paragra = false
- ;�ֶ���ֵ������÷ִ�����ֵ��ֶ�(Ĭ��0.4)
- threshold_do_paragra = 0.3
- ;ÿ�仰������ֵĬ��Ϊ30bytes(��������Ϊ28�����߲�ʹ�ô����ã�)
- threshold_senten_byteNum = 28
- ;������ٴʺ�����ֶ�Ԥ�⣬��ҪС��400�ʣ�����1000���ţ����ߣ�
- ;����ʱ����ʾ�ۼƶ��ٴ�ǿ�У�����60�ʽ���
- threshold_article_wordNum = 60
- ;#################################################################
- ;# ��������������á�colloqproc�� #
- ;#################################################################
- [postproc\colloqproc]
- Colloq_BinURL=pproc/resource_2_0_12/bin_model/Colloq_v2.bin
- [logger]
- file = ../log/postproc.log
- level =
- output =
- flush =
- maxsize =
- overwrite =
|