소셜빅데이터 분석을 위한 식품안전 온톨로지 구축
Ontology of Food Safety for the Social Big Data Analysis
Article information
Trans Abstract
Objectives
Anxiety of citizens on food safety is relatively high. Groundless anxiety on food could build mistaken dietary culture. Therefore, there needs to be risk communication based on verification for recognition of citizens on food safety. As existing questionnaire method or recognition survey via FGI have various limits, recognition survey through internet big data is certainly necessary. Object of this study is to develop food safety ontology which is surely necessary for big data analysis on food safety.
Methods
In this study, all keywords of accidents relevant to food safety were derived from 62 precedent studies in 5 sectors such as food safety policies, food hygiene, recognition on food safety, activities relevant to food safety, the media as well as food gadgets(Food Journal) from 2011 to 2014. Those keywords were categorized and classified according to 5 phases which were modified and supplemented from its original development methodology named ‘Ontology Development 101’ in order to develop ontology.
Results
Keywords related to food safety were classified into high classes including ‘Preventive factors’, ‘Generating factors’, ‘Consequence factors’, ‘Social relationship factors’ after classification for subjects with their common attributes. These high classes were categorized into middle class 1, middle class 2 and small class in order to develop final ontology.
Conclusions
As food safety is directly connected with health of citizens, both big data research on it and development of ontology which is a research tool necessary for big data analysis is essential. Therefore, this research was significant thanks to development of ontology for food safety necessary for further various big data analysis on food safety at the first time.
서 론
산업화 시대 이후 급증한 식품안전사고는 국민들의 식품 소비를 위축시키고 막연한 공포감 조성으로 올바른 식품 섭취 행태를 유지할 수 없도록 한다. 정부와 식품제조업체는 식품안전 사고를 미연에 방지하고, 일어난 사건에 대해서는 소비자 피해를 최소화하면서 올바르고 신속한 정보 전달이 될 수 있도록 하고자 한다. 하지만 정부와 산업체, 소비자의 식품 안전에 대한 커뮤니케이션은 다소 미비한 실정이다. 2014년 한국보건사회연구원이 조사한 ‘식품안전체감도 조사’ [1]에 따르면 25.6%가 ‘불안’, 25.2%가 ‘안심’, 49.2%가 ‘보통’이라고 답해 소비자의 4명 중 1명은 식품에 대해 불안감을 가지고 있는 것으로 나타났다. 2010년 한국농촌경제연구원의 ‘식품안전에 대한 국민 의식 조사’ 보고서에서는 14.9%가 ‘매우 걱정’, 69.6%는 ‘걱정됨’, 13.5%만 ‘걱정되지 않는다’고 답했고 1.7%만 ‘전혀 걱정 되지 않는다’고 답해 80%가 불안감을 느끼고 있었다는 연구 조사도 있었다. 국민들이 가장 우려하는 식품위해요소로는 중금속과 환경호르몬, 잔류농약과 식품 첨가물이 상위에 오르고 있다[2,3]. 식품안전에 대한 과장된 공포나 잘못된 정보 확산은 경제적 손실과 직결된다. 그릇된 식문화 전파는 국민 건강을 해치는 주요한 요인이 되기도 한다. 이에 식품 안전과 관련된 소비자 인식 정도를 정확히 파악하고 적절한 대응책을 모색할 필요가 있다.
그동안의 식품안전 관련 선행연구는 설문조사에 의존한 경우가 많았다. 설문조사 방식은 소비자의 직접적 생각을 파악할 수 있다는 장점이 있지만 한계점도 있다. 설문조사 항목에 대한 응답은 의식적인 판단이 개입되며, 무의식적인 마음에 대해서는 파악하기 어려운 면이 있다. 또 Focus Group Interview (FGI) 조사 방식 또한 응답이 사회자에 의해 유도될 수 있다는 한계가 있다. 군중심리로 인해 인터뷰이의 생각이 제한될 수 있다는 것이다.
현대는 인터넷 기반의 시대이다. 소비자들은 자신의 걱정거리나 의문점에 대해 대면 대화방식이 아니라 검색방식을 사용해 해결 방법을 모색하는 비율이 높아지고 있다. 블로그나 SNS 등을 통한 지식과 경험, 감정에 대한 공유는 그 자체로서 정보전달자의 기능도 한다. 소셜미디어 속의 메시지는 그 시대의 감성과 정서, 트렌드를 파악할 수 있는 정보의 원천이다. 때문에 기존 연구의 틀에서 벗어나 인터넷 웹상의 빅데이터 수집과 이를 분석하는 방법을 통하여 국민들의 식품안전인식을 살펴볼 필요가 있다. 소셜빅데이터를 분석 · 활용하면 국민들의 식품안전인식은 물론, 식품안전 위험 감정을 높이는 요인을 예측할 수 있어 정부의 식품안전 정책 수립이나 리스크커뮤니케이션, 식품회사의 제품 개발이나 마케팅 등에 활용할 수 있다.
온라인 속에서 표현된 빅데이터는 ‘비정형 데이터’이다. 이들 가운데 의미 있는 키워드를 추출하고 자료를 효과적으로 수집하기 위해서는 식품안전분야의 개념을 추출하고 해당 개념들 간의 관계를 나타내는 온톨로지가 필요하다. 온톨로지는 “해당 개념을 명시적으로 정의하며, 컴퓨터가 처리할 수 있는 형태로 표현하는 용어의 논리적인 집합이면서 개념 간 관계를 명시한 사전의 역할”[4]을 의미한다. 온톨로지가 있어야만 거대한 비정형 빅데이터를 분류해 처리하고, 이를 기존 연구방법들을 통해 다양한 분석을 시도할 수 있다. 빅데이터 수집과 분석은 앞으로 더욱 연구가 활발하게 진행될 영역이며, 특히 식품은 국민 생활과 가장 밀접한 관련성이 있는 주제 영역이기 때문에 앞으로 식품안전에 대한 빅데이터 분석은 더욱 다양하게 진행될 것으로 예상된다. 이에 본 연구는 식품안전 빅데이터 분석을 위해 반드시 필요한 연구도 구인 식품안전 온톨로지를 개발하고자 한다.
연구 방법
본 연구의 식품안전 관련 빅데이터 수집과 분석을 위한 온톨로지 개발 과정은 여러 방법들 중 Noy and McGuinness [5]가 개발한 ‘Ontology Development 101: A Guide to Creating Your First Ontology’의 방식을 기본으로, 이를 수정 · 보완한 방식을 따랐다. Ontology Development 101은 현업에서 가장 대중적이고 실용적으로 쓰이고 있는 온톨로지 개발 방법이다. ‘Ontology Development 101’에서는 “온톨로지 구축법에 대해 고정된 정의는 없으며, 온톨로지의 연구 내용, 사용 영역, 사용자, 개발 목적에 따라서 그 방법이 조금씩 달라져야 한다”고 명시하고 있다[5].
Noy and McGuiness [5]의 Ontology Development 101을 수정 · 보완한 식품안전 온톨로지 구축 과정은 Figure 1과 같이 총 5단계로 나뉜다. 1단계는 ‘온톨로지 영역과 범위 규정’ 단계다. 온톨로지의 사용 목적과 이용자에 따라 범위가 한정될 수 있으므로 이 단계에서 온톨로지 개발의 연구 범위를 제한해야 한다. 본 연구에서는 식품안전과 관련된 온톨로지 범위 내에서도 ‘개인이 접할 수 있는 모든 식품 안전과 관련된 개념’ 중에서도 ‘기존에 일어났던 사건·사고와 관련되어 있거나, 식품 안전 관련 위험성이 높게 평가돼 논의된 적이 있는 연구가 나온 범위’에 한정해 온톨로지를 개발하였다. 두 번째 단계는 ‘선행 온톨로지의 재사용 여부 검토’ 단계다. 선행 온톨로지가 있다면 기존 온톨로지를 수정 · 보완하거나 추가하는 방법으로써 더욱 의미있는 온톨로지를 만들 수 있기 때문이다. 해당 연구 분야에서는 선행 온톨로지 연구가 없는 것으로 나타났다. 세 번째 단계는 자료수집과 용어추출 분야이다. 해당 연구에서는 식품안전과 관련된 광범위한 키워드를 추출하기 위하여 본 연구를 시작한 시기를 기준으로 가장 최신의 연구 데이터인 2011년부터 2014년까지의 식품안전에 대하여 연구한 최신의 연구 자료를 국회도서관 DB 사이트와 학술지문헌 검색사이트를 통해 검토하였다. 결과, 다섯 가지 영역에서 식품안전과 관련한 문헌 62편을 선정(식품위생실태 연구 5편, 식품안전 인식도 연구 15편, 식품안전 정책 연구 17편, 식품안전과 관련된 인간행동과 사회관계에 대한 연구 13편, 식품안전 관련 언론·소비자커뮤니케이션연구 12편)해 고찰하였다. 또한 식품전문지인 『식품저널』의 2011년부터 2014년까지 식품안전 관련 기사를 모두 목록화하여 실생활과 밀접하게 관련된 식품안전 관련 용어가 누락되지 않도록 하였다. 해당 연구와 기사에서 쓰인 식품안전 관련 단어와 어휘 등 키워드들을 모두 추출한 뒤, 네 명의 식품영양학 전공 연구자가 해당 키워드 추출에 대한 크로스 체킹(cross checking) 후 타탕성에 대한 합의를 도출한 키워드만 선정하여 최종 키워드 목록을 선정하게 되었다. 네 번째는 유목화 작업이다. 유목화란 ‘서로 비슷한 정보를 하나의 구성 단위로 묶어주는 것’ [6]으로서, 5가지 선행연구 분야에서 추출된 서로 다른 속성과 클래스들의 키워드들을 ‘식품명’, ‘판매처’, ‘성분명’ 등의 공통 속성으로 묶어나가는 작업을 하였다. 마지막은 계층화이다. Ontology Development 101에서는 ‘온톨로지에 있어 계층화 작업은 필수적이며, 하위 그룹은 상위 그룹과 공통의 속성을 가지며, 하위 속성은 상위 속성에 완전히 포함되어야 한다’고 정의하고 있다. 따라서 본 연구에서는 하위개념의 키워드를 소분류, 중분류를 거쳐 대분류로 계층화하였다.
연구 결과
추출한 키워드를 Bottom-up (상향식) 유목화 방식을 사용하여 그룹끼리 묶어나간 결과, ‘소분류→중분류→대분류’로 계층화될 수 있었다. 최상위 클래스인 대분류는 ‘예방요인’, ‘생성요인’, ‘결과요인’, ‘사회관계요인’으로 분류되었다. 각 분류에 대한 근거는 아래와 같다. 본문의 내용에 언급되는 어휘들은 편의상 [[[어휘]]]는 대분류, [[어휘]]는 중분류, [어휘]는 소분류 1 클래스로 정의하는 기호로 설정하였다.
예방 요인
‘예방요인’ 대분류는 “식품안전을 영위하기 위하여 개인이나 정부 등의 주체가 시행하거나 실천하는 요인”이라는 속성을 갖는다. 식품안전에 있어 예방은 가장 중요한 요소이다 [7]. 원산지 모니터링, 이력추적제, 식품위생법, 식품안전기본법, 식품안전정책, 익혀먹기, 냉장고보관, 신고, 보상 등의 키워드가 이런 속성을 가지고 있어 예방 요인의 하위클래스로 묶였다. 이들 키워드 분류표는 Table 1과 같다.
이들 키워드는 빅데이터 분석을 위해서는 최소한의 의미로 묶는 데이터 세트 축소 유목화(data reduction and categorizing) 작업이 필요하다.
이에 식품위생법, 식품안전기본법, 축산물가공처리법, 농산물품질 관리법 등의 식품 안전을 위해 제정된 법, 그리고 식품의약품안전모니터, 식품안전점검과 같은 정책적 요소는 [정책요인]이라는 상위 클래스로 묶었다. 정책요인은 국민들이 식품관련 정책과 법에 대해 얼마나 잘 인지하고 있는지 알아보기 위한 빅데이터 분석 항목으로 설정할 수 있다. Jeong [8]에 따르면 국민들은 정책과 법을 따로 생각하고 있지 않아 이들을 한데 묶어도 데이터 분석에 있어서 개별 키워드 의미 상쇄가 거의 없을 것으로 보았다.
해썹(HACCP), 표준화공정, 미생물품질기준 등은 [공정관리요인]라는 상위 클래스로 묶었다. 크게 [정책요인] 클래스로 묶일 수도 있지만 빅데이터 분석에서 해당 항목을 따로 살펴볼 필요가 있기 때문에 다른 클래스로 구분하였다. 해썹(HACCP)은 기존의 완제품에 대한 위생관리가 아니라 생산과 제조 단계에서부터 위해 요소를 관리해 식품 위험 요소를 사전 차단하는 선진 관리 시스템으로, 미국 식약처에서도 가장 강조하는 식품안전관리 시스템이다[7]. 이에 한국에서도 해썹을 2006년부터 2012년까지 단계별로 나누어 의무 적용토록 했으며, 현재 그 적용 항목을 점차 늘려가고 있다. 따라서 해당 요인과 식품안전의 관계성을 빅데이터 분석에서 살펴보는 것은 매우 중요하다.
원산지 모니터링, 원산지품질검사, 이력추적제 등은 ‘원산지 검사’라는 공통 속성이 있다. Lee 등[9]의 연구에 따르면 주부에서 식품을 고를 때 가장 중요시하는 요소 중 하나가 원산지였다. 특히 중국과 일본 등에 대한 식품안전 위험이 높기 때문에[10] 식품의 안전성을 위해 원산지를 가장 먼저 살펴보고 구입하는 가정이 늘고 있다. 이력추적제 또한 원산지를 쉽고 정확하게 확인할 수 있도록 하기 위해 만들어진 제도이다.
농약잔류량기준설정, 잔류농약 검사 등의 추출 키워드는 ‘농약 검사’ 키워드로 통합하여 상위 클래스를 정의하였다. Park [11]의 연구에 따르면 식품안전 위험 요인 중 농약이 가장 위해하다고 생각하는 사람들이 많았다. 제도 요인에서 농약 검사 여부에 대하여 얼마나 관심을 가지는지 살펴볼 필요가 있다. 이들 원산지검사, 농약검사는 [검사요인] 항목으로 묶어 분류하였다.
이상의 [정책요인], [공정관리요인], [검사요인]은 식품관련 법과 정책, 위해요소관리 관련제도, 원산지검사, 농약검사가 식품안전 관련 예방요인에서 제도의 영역에 속하기 때문에 [[제도요인]]으로 묶였다.
Ha [12]는 식품안전관련 행동에 대해 언급한 익혀먹기, 가열하기, 찌기, 삶기, 데치기 등은 [조리요인]으로, 냉장고 보관, 상온 보관, 냉동보관, 밀폐보관 등은 [보관요인]으로, 손씻기와 마스크 착용 등은 [개인위생]으로 묶었다. 익히기와 보관하기 등은 식품 위해를 막기 위한 효과적인 관리법으로 분류되고 있다.
사건신고의 경우 식품안전 사건이 발생했을 때 주로 개인이 감시기관에 감식을 의뢰하는 것으로 [신고]로, 신고에 의해 식품업체가 보상을 하는 것은 [보상]의 상위 클래스로 묶어[13] 빅데이터 분석 키워드에 포함되도록 하였다. 리콜과 회수명령은 동의어로서 [회수요인]으로 묶었다. 리스크커뮤니케이션, 정보공개, FightBac캠페인은 식품안전에 대한 소비자와 비소비자간의 커뮤니케이션 작용에 대한 것이므로 [식품안전 리스크커뮤니케이션]으로 유목화하였다. [신고], [보상], [회수], [식품리스크커뮤니케이션]은 식품안전을 유지하기 위해 정부·개인 등에서 대응·예방하는 요인이므로 [[대응 요인]]에 해당하므로 해당 클래스로 묶었다.
생성요인
식품안전 관련 [[[생성요인]]] 클래스는 “식품안전에 있어 문제를 일으키는 요소”라는 속성을 갖는다. 인공색소, 방부제, 벤조피렌, 포름알데하이드, 아플라톡신, 파툴린, 대장균, 살모넬라, 간디스토마 등의 키워드가 이런 속성을 갖고 있어 생성요인의 하위 클래스로 묶였다. 이들 키워드의 분류표는 Table 2 와 같다.
우선 인공색소(청색1호, 청색4호, 수단색소), 발색제, 착향료, 영양강화제, 파라벤, 보존제(이산화황), 보존료, 방부제, 유화제, 산화방지제, 화학조미료(MSG), 감미료(사카린), 가성소다, 염산(껍질제거용 공업용 화학물질) 은 ‘첨가물’로 묶였다. 이들은 모두 “식품의 보존이나 맛과 외관, 향 개선 등의 상품성 향상을 위해 별도로 첨가하는 물질”이라는 속성을 갖고 있다. Jin [14]에 따르면 우리나라 국민은 첨가물에 대해 많은 걱정을 하고 있다. 방사선조사식품과 유전자조작식품도 선행연구에서 반드시 거론되는 한국인이 우려하는 식품안전 위협물질이다[15]. ‘첨가물’, ‘방사선조사식품’, ‘GM작물’ 세 키워드는 “식품의 외부에 인위적으로 조작한다는 속성”이 있기 때문에 [[[생성요인]]]의 [[외부요인]] 중 [조작요인]이라는 상위 클래스로 묶었다. 불량제조식품과 반찬재활용, 유통기한경과 등은 “제조 과정에서의 관리 부실”이라는 속성을 가지고 있으므로 [[[생성요인]]] 중 [[외부요인]] 중 [관리요인]으로 분류하였다.
카벤다짐, 캡탄, 유기인제, 말라카이트그린, 헵타클로르는 ‘살충제’로 묶었다. 엄밀히 말하면 카벤다짐과 캡탄, 유기인제는 농약, 말라카이트그린과 헵타클로르는 살균살충제이지만 해충과 박테리아 등을 없앤다는 같은 속성이 있으므로 살충제로 분류하였다. 질파테롤, 항생제, 성장촉진호르몬제, 스테로이드제는 ‘동물용의약품’으로 분류됐다. 주로 식품의 원재료인 육류, 달걀 등에 쓰여 개체의 질병 저항성을 높이므로써 작업 생산성을 높이는데 쓰인다. 하지만 이 또한 식품의 원재료에 남아 내분비계교란을 일으킬 수 있는 것으로 보고돼 있으므로 빅데이터 분석 시에도 중요하게 고려해야 할 키워드이다. 유리조각, 벌레, 고무, 나무, 동물의 뼈 조각 등은 식품공전상의 분류법을 따라 ‘이물질’로 분류하였다. ‘살충제’, ‘동물용의약품’, ‘이물질’ 모두 식품에 제거되지 않고 잔류하면서 문제를 일으키므로 [잔류요인]으로 묶었다[16].
그밖에 식약처 유해물질 총서 분류 기준[16]에 따라 벤조피렌·아크릴아마이드·아질산염·포름알데히드·포르말린·벤젠·다이옥신·아민류·멜라민·톨루엔·퓨란은 발암물질로, 카드뮴·수은·납·비소·알루미늄은 중금속으로, 세슘·요오드·스트론튬·플루토늄은 방사성물질로, 환경호르몬·나노물질·이형프리온은 내분비계교란물질로 분류하였다. 복어독과 버섯독은 ‘독’으로, 고카페인·카페인음료·카페인중독 등은 ‘카페인’으로 분류하였다.
한편 콜레스테롤, 포화지방, 트렌스지방, 나트륨은 그 특성이 조금씩 다르긴 하지만 모두 “심혈관계에 영향을 미친다”는 공통 속성이 있다. 콜레스테롤과 포화지방, 트렌스지방은 혈관에 혈전을 만들어 고혈압, 심근경색 등을 유발하며 나트륨은 과다섭취 시 고혈압으로 진행될 수 있다 [17]. 콜레스테롤과 포화지방, 트렌스지방은 패스트푸드나 서구식 음식에 많아 한국인의 건강을 위협하는 요인으로 지적되고 있다 [18]. 또 나트륨은 냉면, 짬뽕, 설렁탕 등 외식 메뉴와 라면, 과자 등 가공식품 속에 많이 들어있는 성분으로, 고혈압을 일으키는 주범으로 연구돼 있다 [19]. 식품안전에 있어 심혈관건강을 해치는 생성요인으로서 작용하기 때문에 이들을 생성요인 중 내부요인으로 분류하였다.
위의 ‘발암물질’, ‘중금속’, ‘방사성물질’, ‘내분비계교란물질’, ‘심혈관 건강위해물질’, ‘독’, ‘카페인’은 최종 식품 가공품의에 이미 포함된 [성분요인]으로서, [[내부요인]]이라는 상위 클래스에 속한다.
아플라톡신, 오크라톡신, 데옥시니발레놀, 제랄레논, 파툴린은 식약처의 유해물질 총서에 분류된 근거에 따라 ‘곰팡이’로 분류됐다. 곰팡이는 특히 수입 콩이나 밀 등에 생겨 독성을 일으켜 문제가 되고 있다. 대장균, O-157, 황색포도상구균, 비브리오균, 살모넬라, 리스테리아, 브루셀라, 사가자키균, 클로스트리디움, 바실러스세레우스, 클로스트리디움 역시 식약처 유해물질총서에 분류된 근거에 따라 ‘세균’으로 분류됐다. 노로바이러스, A형간염 바이러스는 사람의 분변이나 침 등이 음식물에 들어가 이동하면서 문제가 일으키는 것으로, 세균과 곰팡이와는 그 속성이 다른 ‘바이러스’로 분류됐다. 특히 2011년 A형간염 바이러스가 사람들이 공용 식기를 쓰는 포장마차를 중심으로 퍼지면서 사회문제가 된 바 있었다. 회충, 십이지장충, 독소플라스마, 간디스토마는 ‘기생충’으로 분류됐다[20]. 이들 곰팡이, 세균, 바이러스, 기생충은 모두 식품의 완재료에 본래부터 포함된 물질이 아니라 유통이나 보관, 서빙 과정 등에서 생성되는 미생물이라는 속성을 가지므로[21] [[내부요인]] 중 [미생물요인]으로 분류하였다.
결과요인
결과요인에 대한 키워드 분류표는 Table 3과 같다. [[[결과요인]]]이라는 대분류는 “식품안전과 관련한 문제가 생긴 결과물”이라는 공통속성이 있다. 선행연구에서 식품안전 관련 문제로 지적된 양파, 마늘, 감자, 당근, 양배추, 고구마, 옥수수, 버섯, 표고버섯 등의 채소류와 포도, 딸기, 복숭아, 오렌지, 자몽 등의 과일을 ‘농산물’로 묶었다. 이들은 주로 농약검출 문제로 기사에서 거론된바 있다. 표고버섯은 특히 방사능 물질 검출 논란이 붉어진 바 있다.
연어, 참치, 민물메기, 민물장어, 영광굴비, 새우살, 명태, 꽃게, 고등어, 장어 등의 어류와 해초, 다시마 등의 해초류와 굴, 바지락, 홍합, 골뱅이 등의 어패류는 모두 ‘수산물’로 묶었다. 수산물은 주로 방사성물질 검출, 비브리오균이나 중금속 문제가 붉어져 기사화된 바 있다.
돼지, 소고기, 닭고기, 미국산 쇠고기, 연골, 등골은 ‘육류’라는 속성으로 묶을 수 있었다. 이들은 주로 위생관련 문제가 많았다.
달걀, 계란은 육류로 묶을 수도 있지만 개별 식품으로 가정에서 많이 사용되는 식품이기 때문에 ‘난류’로 따로 묶었다. 난류는 항생제 문제가 자주 거론된다[22]. ‘농산물’, ‘수산물’, ‘육류’, ‘난류’는 식품의 원재료로서, “가공을 거치지 않았다”는 속성이 있기 때문에 [비가공식품]으로 묶었다.
소시지, 햄, 밀가루, 컵라면, 단무지, 참기름, 고추씨기름, 만두, 고춧가루, 라면, 라면스프, 가쓰오부시, 어묵, 간장, 통조림, 소스, 식용유(튀김유, 팜유), 타피오카, 냉동식품류, 두부, 양념류(된장, 고추장), 식초, 현미, 천일염, 인스턴트카레, 과자류(초콜릿, 시리얼, 수입과자, 아이스크림), 음료(먹는샘물, 사이다, 주류, 술, 맥주, 커피, 더치커피)는 모두 “마트에서 흔히 살 수 있는 식품”이라는 공통 속성이 있다. 또 가공식품이기도 하다. “농산물이나 수산물 등과는 구분되는 가공을 거친, 마트에서 파는 식품”이라는 속성을 갖게 되므로 ‘마트 식품’이라는 한 그룹으로 묶었다.
우유, 분유, 초유, 버터, 마가린, 요구르트, 치즈는 ‘유제품’으로 분류하였다. ‘마트식품’으로 포함될 수도 있지만 유제품은 어린이와 뼈가 약한 주부 등이 주로 섭취하면서 식품에 대한 민감도가 높아 많은 사건 사고들이 발생하기 때문에 ‘유제품’으로 분류하였다.
그밖에 비타민C, 비타민A, 칼슘, 칼륨, 탄수화물, 미네랄, 무기질, 식이섬유는 모두 생리활성 물질로 인정받은 것들이므로 ‘기능성성분’으로 분류하였다.
맥도날드, 피자, 햄버거는 ‘패스트푸드’로, 병원음식, 병원밥, 병원 식당, 환자식은‘병원음식’으로 분류하였다. 포장마차, 번데기, 튀김은 모두 “길거리에서 판다”는 속성이 있으므로 ‘길거리 음식’으로 분류하였다. 또한 학교매점, 문방구식품, 급식은 ‘어린이 관련 식품’으로 분류하였다. 최근 어린이와 청소년 음식의 안전과 위생에 대하여 많은 문제점이 제기된 바 있다[23].
기타로 ‘건강기능식품’, ‘야식배달식품’, ‘홈쇼핑식품’은 각각 선행연구에서 식품안전에 대해 안전성 문제가 꾸준히 제기되고 있어 반드시 다뤄야 할 키워드이나 함께 묶을 수 있는 속성이 없어 키워드를 그대로 유지하였다.
그밖에 선행연구에서 김밥, 도시락, 비빔밥, 뷔페, 자판기, 숯, 찐쌀 등이 식품 위생 부분에 있어 수차례 문제가 된 바 있어 살펴볼 필요가 있기에 이들을 ‘기타’로 분류하였다. 이들 식품은 모두 “가공한다는 속성”이 있으므로 [가공식품]으로 분류하였다.
제조사에 대한 키워드 또한 매우 다양하게 추출되었다. 크라운, 농심, 삼양식품, 빙그레, 오리온, 롯데칠성, 롯데, 동서식품은 문제가 된 식품이 주로 과자와 음료수였으므로 이들 속성으로 묶어 ‘과자음료 제조기업’으로 묶었다.
오비맥주, 카스, 하이트맥주, 하이트진로는 맥주 이물질, 이취사건(2014. 식품안전처 주류안전관리 기획단) 때문에 수집된 것이다. 따라서 ‘주류제조기업’으로 분류하였다.
남양유업, 일동후디스, 아이배넷, 매일유업의 경우 분유와 우유의 이물질 사건 등으로 문제가 된 바 있다. ‘유제품 제조기업’으로 분류하여 살펴볼 필요가 있다.
과자음료 제조기업, 주류제조기업, 유제품제조기업은 [[[결과 요인]]] 중 “제조 주체 중에서도 판매나 접객이 아니라 직접 제조한다”는 속성을 가지고 있으므로 [제조 요인]으로 분류하였다.
홈플러스, 롯데슈퍼, 이마트, 하나로클럽, 농협, 코스트코는 판매처 중에서도 ‘대형 마트’라는 속성을 가지므로 함께 묶었다. 신세계, 현대, 롯데는 백화점이라는 속성이 있어 함께 분류하였다. 생협, 초록마을, 친환경농산물매장은 마트도, 백화점도 아닌 동네 중소형 매장이라는 속성이 있지만 일반 동네슈퍼와는 달리 ‘친환경 매장’이라는 속성이 있으므로 일반 동네슈퍼와는 다른 소분류로 묶었다.
직거래매장, 주문거래는 현대에 들어 새롭게 생겨난 판매 경로이다. 식품안전에 대한 불안감이 커지면서 중간 판매 단계를 거치지 않고 생산자에게 직접 식품을 구입하려는 사람이 늘고 있다. 이에 이들 키워드를 인터넷 쇼핑과 다른 소분류로 구분하여 묶었다. 인터넷쇼핑은 식품안전을 추구하기 위하여 사용하기 보다는 단순 편리성을 위해 사용한다는 속성이 있기 때문이다. 직거래와 주문거래와는 속성에서 다소 차이가 있어 따로 분류하였다.
시장과 장터는 따로 ‘시장’으로 묶었다. 시장과 장터는 보관과 유통의 현대화가 더디기 때문에 식품 안전성에 의문을 제기하는 소비자도 많이 있다. 때문에 ‘시장’이라는 카테고리로 따로 분류하였다.
아웃백, TGIF, 베니건스는 패밀리레스토랑, 김밥천국은 분식, 피로연과 잔치는 ‘기타’로 분류하였다. 이들 모두는 중대한 사건은 아니지만 위생 관련 사건이 여러차례 일어난 사례가 있어 검색을 위한 키워드로 분류하였다.
[[질병요인]]은 많은 키워드가 추출되었는데, 크게 [감염요인]과 [[비감염요인]]으로 묶였다. 식중독, 설사, 배탈, 복통, 콜레라, 이질, 장티푸스, 살모넬라증, 리스테리아증, 브루셀라증은 모두 ‘세균’이라는 공통속성이 있고 조류인플루엔자, 변종 크로이츠펠트 야콥병은 ‘인수공통감염’이라는 공통속성이 있다. 이들은 식약처 유해물질총서에 따라 모두 [감염질환]이라는 공통 속성으로 묶였다.
비만, 당뇨병, 고지혈증, 고혈압, 심장병, 뇌졸중, 동맥경화의 경우 식품의 콜레스테롤, 지방 등의 섭취가 이들 질환을 유발할 수 있다는 선행연구로부터 추출되었다. “갑자기 죽게되는 질병이 아니며, 한번에 치료할 수도 없다”는 속성을 가져 ‘만성질환’으로 분류하였다. 두드러기, 발진, 아토피는 식품 첨가물 등의 알레르기 때문에 문제가 되고 있어 ‘알레르기성 질환’으로 분류하였다.
식품첨가물 섭취가 어린이의 행동장애, 학업수행능력 저하 등을 가져온다는 보고[18]가 있어 사회적 파장이 있었으므로 이를 ‘정신건강’으로 묶어 살펴보고자 하였다. 또한 인터넷 SNS 등의 문서에 식품첨가물과 환경호르몬 등이 암이나 불임 등을 일으킨다고 서술한 문서들이 많아 이를 기타질환으로 분류하여 식품안전과의 관계를 살펴보고자 하였다. 사가자키균 분유 섭취 후, 또는 광우병 등으로 식품과 사망을 연관시키는 사람이 많아 이를 따로 분류하였다.
[[[결과요인]]] 중에는 [[사회경제요인]]도 있었다. 사회경제요인클래스 중 [산업위협] 요인으로는 식품구입기피, 식품산업 위기, 식품파동, 기업피해, 경제적손실, 국가경쟁력약화, 기업부도 등이 추출되었다. 식품안전 사건 사고, 파동 등은 모두 식품 소비 위축으로 이어질 수 있다는 속성이 있으므로 ‘식품산업 침체’라는 요소로 묶었다. 한미통상마찰, 국제통상마찰이라는 키워드는 ‘무역마찰’로 분류하였다.
그밖에 삶의 질 저하, 환경 파괴, 교차오염 등의 키워드는 식품안전 사건으로 인하여 식생활에 어려움을 겪을 수 있다는 것(삶의 질 저하), 오염된 식품의 폐기가 결국 환경파괴로 이어질 수 있다는 것(환경파괴), 식중독 균이나 바이러스 등이 교차 오염되어 감염자 수가 기하급수적으로 늘어 사회적 문제가 될 수 있다는 속성(교차오염) 등이 있어 ‘사회위협’으로 분류하였다.
사회관계요인
사회관계요인에 대한 키워드 분류표는 Table4 와 같다. ‘사회관계요인’이라는 대분류는 “식품안전을 둘러싼 관계”라는 공통 속성이 있다. 식품안전 사건에 특히 관심을 기울이는 사람, 영향을 받거나 주는 단체나 인물, 국가 등을 알아보기 위해 추출한 키워드이다.
우선 식품안전과 남자, 남학생, 아빠, 신랑, 여학생, 엄마, 여자 등의 키워드는 Park [24]의 식품안전의 위험성을 가장 많이 느끼는 집단에 대해서 조사한 연구에서 추출되었다. 이는 남자, 남학생, 아빠, 신랑은 ‘남성’, 여학생, 엄마, 여자는 ‘여성’으로 나눠 분류하였다. 남성과 여성은 식품안전에 대한 관심도가 서로 다르다는 조사 결과가 있었기 때문이다. 아이, 신생아, 유아, 어린이, 영아, 초등학생, 중학생, 고등학생은 ‘자녀’, 학부모, 학부형은 ‘부모’로 묶었다. 가족유무요인에 따라서도 식품안전에 대한 관심이 높거나 낮을 수 있다. 또 Kim 등[25]의 연구에서는 어린 자녀가 있는 가족이 싱글이나 미혼인 경우보다 식품안전에 대한 관심이 높은 것으로 나타났다. 가족은 ‘공동’으로, 싱글과 미혼은 ‘독거’로 분류하였다. 대학생, 환자, 노인, 소비자 키워드는 각각 식품안전과 관련이 높은 관계 요인이지만 공통 속성이 없어 개별 키워드로 유지하였다. 이들은 성별요인(남성, 여성), 자녀유무요인(자녀, 부모), 가족유무요인(공동, 독거)과 함께 [사회적 요인]으로 분류하였다.
식품의약품안전처(식약처, 식약청), 보건복지부(복지부), 질병관리본부, 국립보건원, 공무원, 지자체, 보건산업진흥원, 국민건강영양조사, 통계청, 정부, 국회, 경찰, 검찰, 농림수산식품부, 해양수산부, 국립학술과학원, 행정자치부(행자부, 행정안전부), 식품담당조직, 의약품담당조직, 국립수의과학검역원, 식품안전정보원, 국립농산물품질관리원, 농촌진흥청(농진청), 수산과학원은 ‘정부행정기관’으로 분류하였다. 식품안전에 관한 예방과 검사, 관리, 징벌 등의 행정업무를 담당하고 있다는 공통 속성이 있다.
교사, 교육청, 교육인적자원부, 선생님이라는 키워드는 정부의 교육기관이라는 공통속성이 있다. 식품 안전 관련 예방에 있어 교육기관의 역할이 중요한 것으로 나타나고 있다[26]. 선생님, 교사가 교육청, 교육인적자원부와 같은 층위를 가지는 키워드는 아니지만 따로 분류하기에는 소분류가 너무 많아지므로 ‘교육’이라는 공통 속성을 가진다는 근거 아래 ‘정부 교육기관’으로 묶었다.
‘NIH’, 미국 NHANES, 미국 농무성, 미국국제개발처, 미국환경청, WTO, NAS 등은 식품안전 정책과 관리를 담당하는 국외 기관이다. 이들은 ‘국외 정부기관’으로 분류하였다. ‘정부행정기관’, ‘정부교육기관’, ‘국외정부기관’은 [정부요인]이라는 상위 기관으로 분류되었다.
영양사, 영양학자, 영양교사, 식품영양학과, 식품공학과는 ‘식품학회’, 의사, ‘의사협회(의협)’, 약사는 ‘의약학계’, 교수, 학회는 ‘기타 일반학회’로 묶었다. 이는 사회관계 요인 중 [학계 요인]에서 어떠한 학계가 가장 영향력이 큰가에 대해 알아보고자 하기 위함이다. 그밖에 소비자단체, 소비자시민모임(소시모), 녹색시민연대, 환경단체, 종교단체, 윤리단체, 경실련은 [소비자요인], 무역협회, 한국식품공업협회는 [산업계 요인]으로 분류되었다.
[[국가요인]]에서는 모든 나라의 키워드가 추출된 것은 아니었다. 선행연구에서 주로 거론된 식품안전 관련 국가 키워드는 크게 동양권, 서양권으로 분류되었는데 동양권에는 한국, 중국, 일본 등은 물리적·문화적 거리가 밀접한 관계의 국가이므로 따로 분류하였다. 홍콩과 싱가포르 등은 ‘신흥국가’, 말레이시아와 태국 등은 ‘개발도상국’으로 묶었다. 서양권에는 미국, 유럽, 남미(브라질, 칠레)는 따로, 호주와 캐나다와 같은 청정지역 이미지인 국가로 묶었다. 그 중 식품안전과 관련해서는 중국과 일본에 대한 식품안전 불안감이 가장 높고, 호주, 뉴질랜드, 캐나다 등의 이른바 ‘청정국가’에 대해서는 식품안심 감정이 높기 때문에 이들 키워드를 잘 살펴보는 것이 중요하다[8].
[[[사회관계요인]]]에서 [[미디어요인]]은 기사, 외신, 매스컴, 신문 등의 ‘일반 기사’, 방송, TV, 라디오 등의 ‘방송’, 소비자고발, 불만제로, 이영돈 먹거리X파일 등의 ‘고발프로그램’, SNS, 페이스북, 미투데이, 트위터 등의 인터넷, 전단지, 팜플렛, 포스터, 사진, 세미나, 포럼, 좌담회 등의 ‘공청회’가 있었다. 이들은 [언론요인]과 [비언론요인]으로 나누어 미디어요인에서 어떤 요인이 식품안전에 더 관여하는지 알아보도록 하였다.
고찰 및 결론
국내 소비자의 식품에 대한 불안감은 매우 높은 것으로 조사되고 있다[27]. 이에 식품안전과 관련된 소비자 인식 정도를 파악하고 적절한 대응책을 모색할 필요가 있다. 본 연구는 식품안전에 관한 소셜빅데이터를 분석하기 위한 틀로서, 식품안전 온톨로지를 개발하는데 그 목적이 있다. 기존의 연구는 대부분 설문지법 또는 FGI 조사 방식을 사용하였으나 설문 항목에 제한이 있을 수 있고 응답이 유도될 수 있다는 등의 한계가 있었다[28].
소셜빅데이터는 비가공·비정형데이터로서, 광범위한 데이터를 연구도구로 활용함으로써 연구 대상자의 의중을 보다 정확하게 들여다 볼 수 있다는 장점이 있다[29]. 인터넷과 모바일 시대 이후 대면 대화 방식보다 검색 방식을 통해 해결방법을 모색하고 커뮤니케이션하는 소비자가 늘고 있다. 또한 블로그나 SNS 등을 통한 지식과 경험, 감정에 대한 공유는 그 자체로서 정보전달의 기능도 한다. 그야말로 소셜미디어를 포함한 인터넷은 그 시대의 감성과 정서, 트렌드를 파악하는 정보의 원천으로, 소셜미디어 빅데이터를 분석함으로써 보다 현실적이고 효과적인 식품안전 정책을 수립하는 데 도움이 될 것으로 기대되기 때문이다.
본 연구는 식품안전 소셜빅데이터를 분석하기 위한 틀로서 온톨로지를 개발한 첫 번째 연구라는 것에 큰 의의가 있다. 소셜빅데이터를 수집하면 분석을 하기 위해 체계화된 온톨로지에 따라 키워드를 분류하여야 하는데, 이 때문에 해당 영역의 온톨로지가 필수적이다. 본 연구에서는 식품안전과 관련한 정부 정책과 연구 보고서 62편과 4개년간의 식품안전 사건을 다룬 언론기사(2011년-2014년)를 분석해 식품안전관련 용어를 추출했다. 신뢰성을 높이기 위해 식품영양학 전공의 4명의 연구자가 크로스체크를 하여 중요한 용어가 누락되지 않도록 하였다. 추출된 용어들은 bottom-up 방식으로 유목화, 계층화하는 과정을 거쳤다. 해당 연구에서는 용어들을 소분류, 중분류를 거쳐 ‘예방요인’, ‘생성요인’, ‘결과요인’, ‘사회관계요인’의 총 4가지 대분류로 분류되었다.
기존의 소셜빅데이터 분석을 위한 온톨로지로서는 Park의 저출산 온톨로지 개발이 대표적이다[30]. 본 연구와 마찬가지로 Noy and Mc-guinness [5]가 개발한 ‘Ontology Development 101’의 방식을 따라 저출산 관련 온톨로지를 소분류, 중분류, 대분류로 개발하였다. 본 연구에서는 소셜빅데이터 연구에 보다 적합하도록 소분류, 중분류, 대분류의 경계를 명확히 하여 소셜빅데이터 키워드들이 보다 용이하게 처리될 수 있도록 하였다. 그밖에 온톨로지 연구는 언어학, 인공지능, 화학, 정보시스템, 의학, 지리학 분야 등에서 다양한 분야에서 진행되어왔지만 소셜빅데이터 분석을 위한 것이 아니라 대부분이 컴퓨터 웹사이트 개발, 또는 프로그래밍을 위한 온톨로지 개발 연구였다[4]. 소셜빅데이터를 위한 온톨로지 개발 연구는 현재 초기단계이며, ‘Ontology Development 101’의 방식 외에 다양한 방법론을 이용한 연구가 시도되어야 할 것이다.
해당 연구는 빅데이터 연구개발을 위한 온톨로지 개발의 선행 연구로서 향후 다양한 온톨로지 개발에 있어 선행 사례가 될 것으로 생각된다. 이미 보건 정책 분야의 경우 온톨로지 개발이 진행되고 있어 그를 기반으로 한 빅데이터 분석과 활용이 학계나 산업계에서 활발히 시도되고 있다. 하지만 식품 분야는 소셜빅데이터를 활용한 정책관리나 마케팅 등의 가능성이 매우 큼에도 불구하고 아직 온톨로지가 개발된 사례가 없다. 식품섭취는 국민 생활과 가장 밀접한 관련이 있는 기본 생활 중 하나로[31], 식품에 대한 감정을 소셜미디어나 인터넷을 통해 표현하는 버즈(인터넷 웹 상의 문서나 글, 단어 등)는 점점 더 많아질 것이다[32]. 이런 소셜빅데이터를 활용해 위험 요소를 찾아 리스크커뮤니케이션에 활용하거나 식품업체 등에서는 이를 마케팅이나 위기관리 등에 이용하고자 하는 등의 수요 또한 크게 늘 것이다. 또한 정부 등 관리 부처에서도 소셜빅데이터를 민심의 바로미터로 활용해 정확한 정책 수립에 활용할 수 있을 것이다.
Notes
No potential conflict of interest relevant to this article was reported.