Поиск по набору регэкспов
Поиск по набору регэкспов
Скрипт ищет большое число ошибок — в первую очередь, ошибок распознавания (разрыв слов через тире, неверные сочетания букв, смесь букв цифр, латиница в кириллице, предложения без точки, точка посреди предложения, мусор после сканирования и т. п.). Скрипт, работает с места курсора и останавливается на подозрительном (по его мнению месте) и в левом нижнем углу окна программы (в информационном окне) —появляется подсказка, о какой ошибке может идти речь.
В каждом случае Вам придется решать, ошибка это или нет. Исправления производятся вручную в тексте. После этого запустите скрипт дальше.
Если вы заметили повторяющуюся ошибку, вы сами можете добавить ее в регэксп. Для этого откройте скрипт в текстовом редакторе (например: Notepad. В начале файла увидите правила построения регэкспов) и добавьте свои строки по типу:
tagRegExp(«(?‹![а-яё])гак(?![а-яё])»,"i","Найдено: слово "гак" ("так" с опечаткой).");
tagRegExp("(?‹![а-яё])эго(?![а-яё])","i","Найдено: слово "эго" ("это" с опечаткой).");
addRegExp("[A-Za-zА-яЁё][—]","i","Найдено: прилипшее тире в конце и середине слова");
addRegExp("[—][A-Za-zА-яЁё]","i","Найдено: прилипшее тире в начале и середине слова");
Если какой-то регэксп вам кажется лишним, "отключите" его. Для этого откройте скрипт в текстовом редакторе, найдите нужное сочетание, по которому работает поиск, и поставьте в начале строки два слэша: //.
//tagRegExp("(?‹![а-яё])эго(?![а-яё])","i","Найдено: слово "эго" ("это" с опечаткой).").