Применение отношения правдоподобия для разрешения избыточного многообразия в задачах криминалистического автороведения

Авторы

  • Михаил Александрович Марусенко СПбГУ https://orcid.org/0000-0002-0441-7845
  • Вадим Вадимович Петров СПбГУ

DOI:

https://doi.org/10.21638/spbu14.2024.411

Аннотация

В статье рассматривается проблема избыточного многообразия алгоритмов, применяемых для решения задач криминалистического автороведения. Доступность текстов в электронной форме и банализация использования программных средств привели к неконтролируемому многообразию алгоритмов, используемых для решения таких задач. Современный этап развития теории и практики авторской идентификации характеризуется широким распространением и легкой доступностью программных средств, позволяющих обрабатывать тексты, существующие в электронной форме, без дополнительной подготовки. Если на начальном этапе развития этой предметной области объектами исследования были в основном литературные тексты, то сегодня в центре внимания оказались электронные тексты (e-mail, SMS, чаты). Это создает у пользователей подобных текстов иллюзию отсутствия необходимости хотя бы общего ознакомления с основными положениями стилеметрии (как минимум таких, как требование жанровостилевой однородности исследуемых текстов, исключение речи персонажей и обработка только авторской речи, приоритет синтаксиса над лексикой), возникшей уже довольно давно. Нередко за стилистический анализ выдаются формальные процедуры, например разбиение текста на n-граммы. Отсутствие инструментов валидации результатов криминалистических экспертиз в этой сфере затрудняет их использование в юридической практике. В англосаксонских юрисдикциях обязательно применение метода оценки отношения правдоподобия (likelihood ratio, LR) при проверке статистических гипотез. Данное отношение показывает вероятность сходства между текстом известного происхождения и атрибутируемым текстом для нулевой гипотезы (Но), согласно которой оба текста имеют одно происхождение, против альтернативной гипотезы (На), в соответствии с которой у них разное происхождение. Применение этого метода позволяет сократить избыточное многообразие алгоритмов идентификации за счет отказа от использования алгоритмов, не включающих проверку статистических гипотез и оценку LR.

Ключевые слова:

криминалистическое автороведение, отношение правдоподобия, проверка статистических гипотез, авторская идентификация, индивидуальный авторский стиль, атрибуция, нулевая гипотеза, альтернативная гипотеза

Скачивания

Данные скачивания пока недоступны.
 

Библиографические ссылки

Библиография

Луценко, Е. В. 2004. «Атрибуция анонимных и псевдонимных текстов в системно-когнитивном анализе». Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета 5: 36–56. Дата обращения 11 ноября, 2024. http://ej.kubagro.ru/2004/03/03.

Марусенко, М. А. 1990. Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов. Л.: Изд-во Ленингр. гос. ун-та.

Марусенко, М. А., В. В. Петров, К. Р. Пиотровская, И. Н. Маньяс, Н. К. Мамаев. 2019. «Об авторстве “писем Берии из заточения”». Вестник Санкт-Петербургского университета. Право 3: 568–605.

Петров, В. В., М. А. Марусенко. 2017. «Об истинном авторе “Записки Юровского”». Вестник Санкт-Петербургского университета. Право 8 (1): 76–107.

Рейхесберг, Н. М. 1894. Адольф Кетле. Его жизнь, и научная деятельность. СПб.: Тип. Ю. Н. Эрлих.

Седова, Т. А., С. П. Кушниренко, В. Д. Пристансков, ред. 2021. Криминалистика. М.: Юстиция.

Aitken, C. G. G., F. Taroni. 2004. Statistics and the evaluation of evidence for forensic scientists. Chichester: John Wiley & Sons.

Aitken, C. G., D. A. Stoney. 1991. The use of statistics in forensic science. New York; London: Ellis Horwood.

Aitken, C., C. E. Y. Berger, J. S. Buckleton, C. Champod, J. Curran, A. P. Dawid, I. W. Evett, P. Gill, J. Gonzalez-Rodriguez, G. Jackson, A. Kloosterman, T. Lovelock, D. Lucy, P. Margot, L. McKenn, D. Meuwly, C. Neumann, N. N. Daeid, A. Nordgaard, R. Puch-Solis, B. Rasmusson, M. Redmayne, P. Roberts, B. Robertson, C. P. Roux, M. Sjerps, F. Taroni, T. Tjin-A-Tsoi, G. Vignaux, S. Willis, G. Zadora. 2011. “Expressing evaluative opinions: A position statement”. Scientific Justice 51: 1–2. https://doi.org/10.1515/9783110228069.

Alred, G. J., C. T. Brusaw, W. E. Oliu. 2008. Handbook of technical writing. 9th ed. Bedford: St. Martin’s Press.

Amelin, K., O. Granichin, N. Kizhaeva, Z. Volkovich. 2018. “Patterning of writing style evolution by means of dynamic similarity”. Pattern Recognition 77: 45–64.

Baldwin, J. 1979. “Phonetics and speaker identification”. Medicine, Science and the Law 9: 231–232.

Basson, J.-C., D. Labbe. 2020. “Les precieux manuscrits”. Proceedings of the 15th International Conference on Statistical Analysis of Textual Data (16–19 june 2020). Toulouse. Дата обращения 11 ноября, 2024. http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/BASSON_LABBE_JADT2020.pdf.

Burrows, J. F. 2002. “Delta: A measure of stylistic difference and a guide to likely authorship”. Literary and Linguistic Computing 17 (3): 267–287.

Chaski, C. E. 2005. “Who is at the keyboard. Authorship attribution in digital evidence investigations”. International Journal of Digital Evidence 4 (1): 1–14.

Glaudes, P., A. Cervoni, F. Guglielmi, C. Mayaux, M. Marusenko, Ye. Kuralesina, M. Miretina, Y. Nikitina, M. Solovyeva, O. Khutoretskaya. 2022. “Jules Barbey d’Aurevilly et corpus journalistique. Problemes d’attribution”. Observer la vie litteraire. Etudes litteraires et numeriques 2: 261–304.

Holmes, D. I. 1998. “The evolution of stylometry in humanities scholarship”. Literary and Linguistic Computing 13 (3): 111–117.

Johnson, A., D. Wright. 2014. “Identifying idiolect in forensic authorship attribution”. Language and Law = Linguagem e Direito 1 (1): 37–69.

Malyutov, M. B., C. I. Wickramasinghe, S. Li. 2007. “Conditional complexity of compression for authorship attribution”. SFB 649 Discussion Paper. Дата обращения 11 ноября, 2024. https://scholar.google.co.id/citations?view_op=view_citation&hl=en&user=auS8PHEAAAAJ&cstart=20&pagesize=80&citation_for_view=auS8PHEAAAAJ:LkGwnXOMwfcC.

Morrison, G. S. 2011. “Measuring the validity and reliability of forensic likelihood-ratio systems”. Scientific Justice 51: 91–98.

Oliveira J., W. E. Justino, L. S. Oliveira. 2013. “Comparing compression models for authorship attribution”. Forensic Science International 228: 100–104.

Pavelec, D., E. Justino, L. S. Oliveira. 2007. “Author identification using stylometric features”. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial 11 (36): 59–65.

Robertson, B., T. Vignaux, C. Berger. 1995. Interpreting evidence: Evaluating forensic science in the courtroom. Chichester: John Wiley & Sons.

Saks, M. J. 2010. “Forensic identification: From a faith-based ‘Science’ to a scientific science”. Forensic Science International 201: 14–17.

Savoy, J. 2012. “Authorship attribution: A comparative study of three text corpora and three languages”. Journal of Quantitative Linguistics 19 (2): 132–161.

Varney, M. H. 1977. “Forensic linguistics”. English Today 13 (4): 42–47.

Zheng, R., J. Li, H. Chen, Z. Huang. 2006. “A framework for authorship identification of online messages: Writing-style features and classification techniques”. Journal of the American Society for Information Science & Technology 57 (3): 378–393.

References

Aitken, C. G. G., D. A. Stoney. 1991. The Use of Statistics in Forensic Science. New York; London, Ellis Horwood.

Aitken, C. G. G., F. Taroni. 2004. Statistics and the evaluation of evidence for forensic scientists. Chichester, John Wiley & Sons.

Aitken, C., C. E. Y. Berger, J. S. Buckleton, C. Champod, J. Curran, A. P. Dawid, I. W. Evett, P. Gill, J. Gonzalez-Rodriguez, G. Jackson, A. Kloosterman, T. Lovelock, D. Lucy, P. Margot, L. McKenn, D. Meuwly, C. Neumann, N. N. Daeid, A. Nordgaard, R. Puch-Solis, B. Rasmusson, M. Redmayne, P. Roberts, B. Robertson, C. P. Roux, M. Sjerps, F. Taroni, T. Tjin-A-Tsoi, G. Vignaux, S. Willis, G. Zadora. 2011. Expressing evaluative opinions: a position statement. Scientific Justice 51: 1–2. https://doi.org/10.1515/9783110228069.1

Alred, G. J., C. T. Brusaw, W. Oliu. E. 2008. Handbook of technical writing. 9th ed. Bedford, St. Martin’s Press.

Amelin, K., O. Granichin, N. Kizhaeva, Z. Volkovich. 2018. “Patterning of writing style evolution by means of dynamic similarity”. Pattern Recognition 77: 45–64.

Baldwin, J. 1979. “Phonetics and speaker identification”. Medicine, Science and the Law 9: 231–232.

Basson, J.-C., D. Labbe. 2020. “Les precieux manuscrits”. Proceedings of the 15th International Conference on Statistical Analysis of Textual Data (16–19 june 2020). Toulouse. Accessed November 11, 2024. http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/BASSON_LABBE_JADT2020.pdf.

Burrows, J. F. 2002. “Delta: A measure of stylistic difference and a guide to likely authorship”. Literary and Linguistic Computing 17 (3): 267–287.

Chaski, C. E. 2005. “Who is at the keyboard. Authorship attribution in digital evidence investigations”. International Journal of Digital Evidence 4 (1): 1–14.

Glaudes, P., A. Cervoni, F. Guglielmi, C. Mayaux, M. Marusenko, Y. Kuralesina, M. Miretina, Y. Nikitina, M. Solovyeva, O. Khutoretskaya. 2022. “Jules Barbey d’Aurevilly et corpus journalistique. Problemes d’attribution”. Observer la vie litteraire. Etudes litteraires et numeriques 2: 261–304.

Holmes, D. I. 1998. “The evolution of stylometry in humanities scholarship”. Literary and Linguistic Computing 13 (3): 111–117.

Johnson, A., D. Wright. 2014. “Identifying idiolect in forensic authorship attribution”. Language and Law = Linguagem e Direito 1 (1): 37–69.

Lutsenko, E. V. “Attribution of anonymous and pseudonymous texts in system-cognitive analysis”. Politematicheskii setevoi elektronnyi nauchnyi zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta 5: 36–56. Accessed November 11, 2024. http://ej.kubagro.ru/2004/03/03.

Malyutov, M. B., C. I. Wickramasinghe, S. Li. 2007. “Conditional complexity of compression for authorship attribution”. SFB 649 Discussion Paper. Accessed November 11, 2024. https://scholar.google.co.id/citations?view_op=view_citation&hl=en&user=auS8PHEAAAAJ&cstart=20&pagesize=80&citation_for_view=auS8PHEAAAAJ:LkGwnXOMwfcC.

Marusenko, M. A. 1990. Attribution of anonymous and pseudonymous literary works by methods of pattern recognition theory. Leningrad, Leningradskii gosudarstvennyi universitet Publ. (In Russian)

Marusenko, M. A., V. V. Petrov, K. R. Piotrovskaya, I. N. Manyas, N. K. Mamaev. 2019. “On the authorship of ‘Beria’s letters from imprisonment’”. Vestnik Sankt Petersburgskogo Universiteta. Pravo 3: 568–605. (In Russian)

Morrison, G. S. 2011. “Measuring the validity and reliability of forensic likelihood-ratio systems”. Scientific Justice 51: 91–98.

Oliveira J., W. E. Justino, L. S. Oliveira. 2013. “Comparing compression models for authorship attribution”. Forensic Science International 228: 100–104.

Pavelec, D., E. Justino, L. S. Oliveira. 2007. “Author identification using stylometric features”. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial 11 (36): 59–65.

Petrov, V. V., M. A. Marusenko. 2017. “On the true author of Yurovsky’s Notes”. Vestnik Sankt Petersburgskogo Universiteta. Pravo 8 (1): 76–107. (In Russian)

Reichesberg, N. M. 1894. Adolph Quetelet. His life and scientific work. St. Petersburg, Tipografiia Yu. N. Ehrlich Publ. (In Russian)

Robertson, B., T. Vignaux, C. Berger. 1995. Interpreting evidence: Evaluating forensic science in the courtroom. Chichester, John Wiley & Sons.

Saks, M. J. 2010. “Forensic identification: From a faith-based ‘Science’ to a scientific science”. Forensic Science International 201: 14–17.

Savoy, J. 2012. “Authorship attribution: A comparative study of three text corpora and three languages”. Journal of Quantitative Linguistics 19 (2): 132–161.

Sedova, T. A., S. P. Kushnirenko, V. D. Pristanskov, eds. 2021. Forensic science. Moscow, Iustitsiia Publ. (In Russian)

Varney, M. H. 1977. “Forensic linguistics”. English Today 13 (4): 42–47.

Zheng, R., J. Li, H. Chen, Z. Huang. 2006. “A framework for authorship identification of online messages: Writing-style features and classification techniques”. Journal of the American Society for Information Science & Technology 57 (3): 378–393.

Загрузки

Опубликован

28.12.2024

Как цитировать

Марусенко, М. А., & Петров , В. В. (2024). Применение отношения правдоподобия для разрешения избыточного многообразия в задачах криминалистического автороведения. Вестник Санкт-Петербургского университета. Право, 15(4), 1086–1097. https://doi.org/10.21638/spbu14.2024.411

Выпуск

Раздел

Криминалистика

Наиболее читаемые статьи этого автора (авторов)