Page 8 - tmp
P. 8
Оптичко препознавање хемијских формула угљоводоника
Тамара Станковић
tjstankovic@gmail.com
Регионални центар за таленте Ниш
одговара, док се линије могу посматрати као
1 Увод компоненте које нису слова и цифре.
Хемијска теорија графова представља грану
математике којом се моделирају молекули у циљу Одређивање повезаности карактера
стицања увида у физичке, хемијске и биолошке Даље је потребно одредити која слова су међусобно
особине једињења и њихове што боље апроксимације. повезана (и којим линијама). Два слова су повезана
Дигитализација података је процес претварања оном линијом која им је физички најближа. За сваку
аналогног сигнала у дигитални облик. Да би се процес линију могуће је одредити која два слова она повезује
дигитализација података убрзао и спречила могућност и потом попунити матрицу суседства молекуларног
грешке, развијени су различити алгоритми за оптичко графа.
препознавање карактера. Један од алгоритама за
оптичко препознавање карактера коришћен је и у овом Одређивање молекула
раду. Циљ овог рада је проналажење и описивање
поступка да од дате фотографије хемијске формуле Уз помоћ добијене матрице суседства у молекуларном
рачунар закључи о којој формули, односно, о ком графу са слике, потребно је одредити који је граф,
молекуларном графу се ради. Зато је ово проблем односно, које је једињење у питању. За то су
оптичког препознавања графова уз помоћ рачунара. искоришћена хемијска својства угљоводоника и
вредност Wienerovog индекса, за чије израчунавање је
коришћен Floyd-Warshallov алгоритам. Упоређивањем
2 Методе рада добијене вредности Wienerovog индекса са табличним
Поступак за оптичко препознавање хемијских формула вредностима, закључује се које је хемијско једињeње
угљоводоника састоји се из следећих корака. приказано на слици.
Обрада фотографије 3 Резутати истраживања
Да би се фотографија представила на рачунару, мора У сврху овог рада написана је апликација
се дигитализовати. Прво што је потребно урадити је „HemijskeFormule“, у програмском језику Јаvа и сви
превести фотографију која је у RGB моделу у резултати добијени су коришћењем те апликације.
фотографију у нијансама сиве боје. Могуће је за сваки Апликација је тестирана на 150 фотографија хемијских
пиксел одредити вредности црвеног, зеленог и плавог формула. Тачност резултата је посматрана у односу на
канала и искористи једноставну формулу која одређује одрђене параметре, као што су врста хемијcке
нијансу сиве која одговара том пикселу: формуле, број C-атома у молекулу, врста хемијске везе
и њен положај на фотографији. Тачност препознавања
= 0.21∙ +0.71∙ +0.07∙ . Слику, која је
добијена претходно описаним поступком, потребно је молекулских формула је 93%, док је тачност
превести у матрицу нула и јединица. За то се користи препознавања структурних формула 71%. Тачност
Оtsu метод. препознавања опада са повећањем броја атома у
молекулу, док се, у зависности од врсте хемијске везе,
најбољи резултати постижу за алкане. Укупна тачност
Издвајање и обрада карактера и линија ове апликације је 80%.
У тако добијеној матрици слике, циљ је пронаћи
спојене "црне" површине, које тако груписане 4 Закључак
представљају неки карактер или линију. За то је
искоришћен алгоритам за претрагу графа DFS (Depth- Добијени резултати се сматрају задовољавајућим и
First Search). Овако издвојене компоненте се смањују представљају напредак у области оптичког
или повећавају да све буду димензија 20x20. препознавања графова.
Препознавање карактера и линија 5 Литература
За препознавање карактера коришћен је алгоритам Дејан Живковић. Основе дизајна и анализе
машинског учења - неурална мрежа. За сваку од алгоритама. Рачунарски факултет Београд и CET,
компоненти одређује се да ли је неки од карактера (C, Београд 2007.
H и цифре 0-9) или је линија. Имплементација Andrew Ng. Machine Learning. Stanford University,
неуралне мреже извршена је уз помоћ апликативног Coursera 2013.
софтвера Neuroph. Неурална мрежа за сваку од
компоненти одређује који карактер јој највише Nobuyuki Otsu. A Threshold Selection Method from
Gray-Level Histograms. IEEE Transaction on Systems,
Man, and Cybernetics, 1979.