Поиск по набору регэкспов

Поиск по набору регэкспов

Скрипт ищет большое число ошибок — в первую очередь, ошибок распознавания (разрыв слов через тире, неверные сочетания букв, смесь букв цифр, латиница в кириллице, предложения без точки, точка посреди предложения, мусор после сканирования и т. п.). Скрипт, работает с места курсора и останавливается на подозрительном (по его мнению месте) и в левом нижнем углу окна программы (в информационном окне) —появляется подсказка, о какой ошибке может идти речь.

В каждом случае Вам придется решать, ошибка это или нет. Исправления производятся вручную в тексте. После этого запустите скрипт дальше.

Если вы заметили повторяющуюся ошибку, вы сами можете добавить ее в регэксп. Для этого откройте скрипт в текстовом редакторе (например: Notepad. В начале файла увидите правила построения регэкспов) и добавьте свои строки по типу:

tagRegExp(«(?‹![а-яё])гак(?![а-яё])»,"i","Найдено: слово "гак" ("так" с опечаткой).");

tagRegExp("(?‹![а-яё])эго(?![а-яё])","i","Найдено: слово "эго" ("это" с опечаткой).");

addRegExp("[A-Za-zА-яЁё][—]","i","Найдено: прилипшее тире в конце и середине слова");

addRegExp("[—][A-Za-zА-яЁё]","i","Найдено: прилипшее тире в начале и середине слова");

Если какой-то регэксп вам кажется лишним, "отключите" его. Для этого откройте скрипт в текстовом редакторе, найдите нужное сочетание, по которому работает поиск, и поставьте в начале строки два слэша: //.

//tagRegExp("(?‹![а-яё])эго(?![а-яё])","i","Найдено: слово "эго" ("это" с опечаткой).").