임신성 당뇨와 모유수유에 대한 연구 동향 분석: 텍스트네트워크 분석과 토픽모델링 중심

A study on research trends for gestational diabetes mellitus and breastfeeding: Focusing on text network analysis and topic modeling

Article information

J Korean Acad Soc Nurs Educ. 2021;27(2):175-185
Publication date (electronic) : 2021 May 31
doi : https://doi.org/10.5977/jkasne.2021.27.2.175
이정림1)orcid_icon, 김영지2)orcid_icon, 곽은주3)orcid_icon, 박승미4),orcid_icon
1) 대전대학교 간호학과, 교수
1) Professor, Daejeon University
2) 공주대학교 간호학과, 교수
2) Professor, Kongju National University
3) 충북대학교 간호학과, 강사
3) Lecturer, Chungbuk National University
4) 충북대학교 간호학과, 교수
4) Professor, Chungbuk National University
Address reprint requests to: Seungmi Park Department of Nursing Science, Chungbuk National University 1 Chungdae-ro, Seowon-gu, Cheongju-si, Chungcheongbuk-do, 28644, Republic of Korea Tel: +82-43-249-1712 Fax: +82-43-266-1710 E-mail: spark2020@chungbuk.ac.kr
*이 논문은 2019년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임.*This research was supported by the Basic Science Research Program through the National Research Foundation of Korea (NRF) funded by the Ministry of Education (NRF-2019R1I1A3A01059963).
Received 2021 May 07; Revised 2021 May 18; Accepted 2021 May 18.

Abstract

Purpose

The aim of this study was to identify core keywords and topic groups in the ‘Gestational diabetes mellitus (GDM) and Breastfeeding’ field of research for better understanding research trends in the past 20 years.

Methods

This was a text-mining and topic modeling study composed of four steps: 1) collecting abstracts, 2) extracting and cleaning semantic morphemes, 3) building a co-occurrence matrix, and 4) analyzing network features and clustering topic groups.

Results

A total of 635 papers published between 2001 and 2020 were found in databases (Web of Science, CINAHL, RISS, DBPIA, RISS, KISS). Among them, 3,639 words extracted from 366 articles selected according to the conditions were analyzed by text network analysis and topic modeling. The most important keywords were ’exposure’, ‘fetus’, ‘hypoglycemia’, ’prevention’ and ’program’. Six topic groups were identified through topic modeling. The main topics of the study were ‘cardiovascular disease’ and ’obesity’. Through the topic modeling analysis, six themes were derived: ‘cardiovascular disease’, ‘obesity’, ‘complication prevention strategy’, ‘support of breastfeeding’, ‘educational program’ and ‘management of GDM’.

Conclusion

This study showed that over the past 20 years many studies have been conducted on complications such as cardiovascular diseases and obesity related to gestational diabetes and breastfeeding. In order to prevent complications of gestational diabetes and promote breastfeeding, various nursing interventions, including gestational diabetes management and educational programs for GDM pregnancies, should be developed in nursing fields.

서 론

연구의 필요성

여성의 교육기간 증가와 사회참여 확대로 결혼 및 출산 연령이 증가하였고, 2019년 조사된 35세 이후의 모성 출산율은 2009년도에 조사한 수치에 비해 약 2.2배 증가하였다[1]. 이러한 고령 산모의 증가는 임신성 당뇨를 포함한 고위험 임신 증가의 원인이 되고 있다. 국제 당뇨병 연맹의 2019년 통계에 따르면, 전세계 출산 여성의 15.8%에서 당뇨가 발생하였고 이 중 75~90%는 임신성 당뇨인 것으로 파악되었다[2].

임신성 당뇨(Gestational Diabetes Mellitus, GDM)는 임신기간 중 발병되거나 지각된 고혈당증을 말하며 정확한 원인은 밝혀지지 않았으나, 연령이 높아짐에 따라 유병률이 두드러지게 증가하고, 특히 45~49세 사이의 고령 산모군에서 가장 높은 유병률을 보이고 있다[2]. 국내에서도 임신성 당뇨의 위험이 높은 45~49세 사이의 고령 산모군의 국내 출산율은 2019년에 전년 대비 3.26%가 증가하는 경향을 보이고 있다[1]. 이와 같이 국내외적으로 증가하고 산모와 태아의 건강을 위협하는 임신성 당뇨를 관리하고 예방하기 위한 건강증진전략이 필요하다.

임신성 당뇨로 진단될 경우 여러 가지 합병증의 위험이 높아진다. 임신성 당뇨는 조산 또는 과체중아, 거대아 출산과 관련된 난산의 위험성을 높이고, 분만 후 산모에서 고혈압, 심장질환, 제2형 당뇨병 등의 모체 이환율을 증가시킨다[2,3]. 또한 임신성 당뇨 산모의 자녀는 선천성 질환, 신생아 저혈당 및 소아 당뇨 등의 발생 위험이 높으며, 성인이 되어서는 제2형 당뇨병과 같은 만성질환이 증가한다[4,5]. 이와 같이 임신성 당뇨는 모아 건강에 중대한 영향을 미치는 대사질환이기에, 효과적인 산전 및 산후 관리를 통해 산모의 혈당을 조절하고 합병증 예방을 위한 중재들이 적용되어야 한다[2,5].

임신성 당뇨 산모가 모유수유를 실천하게 되면 산후 모체의 혈당조절에 긍정적인 영향을 줄 뿐 아니라 산모의 회복과 신생아의 건강에도 유익하다[6]. 모유는 영아의 균형 잡힌 성장과 발달에 가장 유익한 모체의 영양원으로, 세계보건기구(World Health Organization, WHO)와 유엔아동기금(United Nation Children’s Emergency Fund)에서는 출생 후 최소 6개월 동안 완전 모유수유를 권장하고 있다[7]. 출생 직후부터 생후 6개월까지 모유만 먹인 비율을 완전 모유수유율이라 하며[7], 국내 선행 연구에서 조사된 모유수유율은 생후 1개월에 54.0%, 생후 6개월에 9.4%로 완전 모유수유율은 매우 낮은 실정이다[8]. 모유는 모체의 저장된 기질에서 합성되며, 모유수유를 하면 모체의 인슐린 요구량이 감소되어 혈당을 낮추는 효과가 있다. 따라서, 모유수유 기간이 길어지면 임신성 당뇨 산모와 아동의 대사질환 발생 위험이 감소하게 된다고 알려져 있다[9,10].

임신성 당뇨와 모유수유를 체계적으로 검토한 문헌에서[11] 임신성 당뇨 산모는 모유수유의 이득이 더 큼에도 불구하고 정상 산모에 비해 모유수유율이 낮고 모유수유 기간이 짧다고 보고되고 있다[11]. 선행 연구에서는 임신성 당뇨와 모유수유의 연관성, 임신성 당뇨 임산부의 모유수유 의도 요인에 대한 조사 등이 이루어져 왔으며[11,12], 축적된 연구 논문들의 결과를 요약하고 분석하는 메타분석이 이루어졌는데, 메타분석도 여러 연구들로부터 도출된 다양한 연구결과를 체계적으로 통합하여 분석하는 계량적인 접근이나 분석에 포함되는 논문의 수가 적어 연구의 주제와 방향을 찾기에는 어려움이 있다. 임신성 당뇨 산모의 모유수유 증진을 위해서 현재까지 시행되어 왔던 연구들을 통합적으로 분석하여 주요 개념과 연구방향을 찾아내고, 앞으로 확대되어야 할 연구 영역을 모색할 필요가 있다. 본 연구에서는 최근 다양한 학문 분야에서 많이 이용되고 연구 동향을 보다 자세히 파악할 수 있는 텍스트네트워크 분석기법과 토픽모델링을 활용하고자 한다.

텍스트네트워크 분석은 단어들 간의 의미론적 관계를 네트워크 구조로 파악하는 분석기법으로 텍스트에 내재되어 있는 주요 의미를 파악할 수 있고, 전체 지식체 내에서 주로 논의되는 연구 주제를 파악할 수 있는 유용한 방법이다[13]. 또한, 토픽모델링은 연관 관계가 높은 단어들로 구성된 벡터 형태의 패턴을 통해 단어와 문서의 분포를 추정하여 해당 문서의 주요 단어와 분류를 모델링하는 것으로 연구동향을 분석하는데 유용한 접근이다[14]. 이에 본 연구에서는 텍스트네트워크 분석과 토픽모델링을 이용하여 임신성 당뇨와 모유수유에 대한 연구들의 핵심 키워드를 규명하여 연구동향을 파악하고, 이를 바탕으로 임신성 당뇨 산모의 모유수유 증진을 위한 중재를 개발하는데 필요한 기초자료를 제공하고자 한다.

연구 목적

본 연구의 목적은 텍스트네트워크 분석과 토픽모델링 기법을 이용하여 임신성 당뇨와 모유수유에 대한 연구를 분석하여 단어의 출현 빈도와 중심성 지표에 근거하여 핵심 개념과 하위 주제 그룹을 파악하고, 임신성 당뇨관리 및 모유수유 증진을 위한 프로그램 개발 및 관련 연구의 활성화를 위한 기초자료로 활용하고자 한다.

연구 방법

연구 설계

본 연구는 ‘임신성 당뇨 및 모유수유’와 관련된 연구들의 초록을 대상으로 텍스트네트워크 분석 및 토픽모델링 기법을 이용하여 핵심 개념과 연구주제를 기술한 텍스트 마이닝 연구이다.

연구 대상

본 연구의 대상은 ‘임신성 당뇨 및 모유수유’와 관련된 연구들로, 의학, 간호학, 보건학 학술지에 2001년부터 2020년 사이에 출판된 국내 및 국외 논문을 대상으로 하였다.

자료 수집

국외 자료는 Web of Science, Cumulative Index to Nursing and Allied Health Literature (CINAHL), Scopus의 3개의 데이터베이스를 이용했고, 국내 자료는 누리미디어(DBPIA), 학술연구정보서비스(RISS), 학술정보원(KISS)의 3개의 데이터베이스를 이용하여 2021년 1월 15일에서 18일까지 최근 20년 발행된 논문을 검색하였다. 각각의 데이터베이스는 연구자들이 많이 사용하는 국내외 데이터로, 등재지와 등재후보지가 포함된 논문을 제공하기에 연구의 신뢰도를 높이고자 선택하였다. 자료수집의 절차는 크게 (1) 대상 문헌의 선정 (2) 분석단위 선정 순으로 진행되었다.

(1) 대상 문헌의 선정: 주제어는 ‘breastfeeding AND gestational diabetes’, ‘breastfeeding AND gestational DM’, ‘breastfeeding AND GDM’으로 검색하였으며, 검색 영역은 초록(abstract), 문서유형은 논문(article), 언어는 영어(English)로 제한하였다. 데이터베이스의 웹사이트를 통해 논문의 제목, 저자, 출판연도, 저널명, 영문 초록을 추출하였다. Web of Science에서 352편, CINAHL에서 251편, Scopus에서 299편이 추출되었고, 국내 논문에서 3편으로 총 905편의 논문이 검색되었다.

① 제외기준: Endnote X9 서지프로그램을 이용하여 중복되는 462편의 자료를 제외하였고, 또한 초록이 없는 논문 18편과 정신과, 약리학, 신장이식, 의사소통 관련 논문 56편을 분석에서 제외하였다.

② 문헌 선정 결과: 본 연구의 연구자 4인이 분석 대상 논문의 초록을 읽고 앞서 언급한 제외기준에 해당하지 않는 문헌을 자료대상으로 선정하였고, 연구자 전원의 의견이 일치하지 않는 문헌은 협의 과정을 거쳐 선정기준에 해당하는지 여부를 재검토하였다. 이와 같이 모든 연구자들이 대상 문헌의 초록을 읽고 협의과정을 거쳐 연구주제와 부합하지 않는 자료를 제외하여 총 366편의 논문을 연구대상으로 선정하였다.

(2) 분석단위 선정: 최종 연구대상으로 선정된 문헌의 초록을 정리하여, 소셜 네트워크 분석 프로그램인 Netminer 4.3.3 version을 이용하여 unstructured text로 변환하여 3,639개의 단어가 추출되었다.

자료 분석

빈도 및 백분율의 기초 통계를 이용하여 연도별 논문의 수를 확인하고, 네트워크 분석과 토픽모델링 분석을 실시하였다.

(1) 기초통계 분석: 최종 추출된 366편의 논문을 게재된 학술지, 연구방법, 분석방법의 유형과 연도별로 분류하고 빈도와 백분율을 이용하여 기술 분석하였다.

(2) 단어의 전처리: 비정형적 텍스트인 논문 초록에서 최소 의미 단위인 형태소를 추출하기 위해, 각 논문의 초록을 엑셀에서 하나의 행으로 구성하고 ‘의미네트워크 분석’ 모듈을 이용하여 데이터의 키워드를 추출하였다. 동시출현 행렬 개발과 텍스트네트워크 분석을 위해 비정형 텍스트 자료를 이용한 단어 전처리 과정, 텍스트네트워크 분석을 실시하였다. 네트워크 분석을 위한 단어의 전처리 과정에서 유의어, 지정어, 제외어 사전을 만들었으며, 키워드에서 대문자는 모두 소문자로 처리하였고, 명사만 추출하여 의미형태소를 생성하여 이를 토대로 형태소를 정제하였다. 지정어 사전은 여러 단어가 하나의 의미를 이루는 단어를 지정할 수 있는 사전으로[15], 단어를 추출하기 위한 정제 과정에서 본 연구에서는 복합명사나 고유명사로 지정되어야 하는 ‘gestational diabetes’, ‘glucose metabolism’, ‘maternal age’, ‘vitamin D’ 등으로 표시되도록 사전으로 정리하였다. 유의어 사전은 동일하고 유사한 의미를 갖지만 표기를 다르게 한 단어들을 하나의 대표어로 정하는 사전으로[15], 예를 들어 ‘gestational diabetes’, ‘gestational diabetes mellitus’, ‘GDM’은 ‘gestational diabetes’를 대표어로 정했다. 제외어 사전에서는 연구방법론과 관련된 단어로 ‘analysis’, ‘conclusion’, ‘objective’, ‘trial’, ‘result’ 등의 단어와 약어, 부호, 그리고 선행연구를 참고하여[16] 빈도분석 결과 출현 빈도 1회인 단어를 제외하였다. TF (Term frequency)는 한 문서 내에서 등장하는 단어의 빈도를 나타내는데 단어의 문서 내에서의 중요도를 나타내고, DF (Document frequency)는 어떤 단어가 몇 개의 문서에 등장하는지를 나타낸다. IDF (Inverse document frequency)는 DF의 역수이며 로그 값으로 표현한다. 그러나, TF값이 높은 단어가 반드시 해당 문서의 키워드라고는 볼 수 없는데, 이는 다른 문서에서도 동일한 단어가 많이 사용될 수 있기 때문이며, 이처럼 다른 문서 집합에도 보편적으로 출현하는 단어들의 IDF값을 구해서 핵심단어 추출에서 제외시켜야 한다. 즉, TF-IDF (Term Frequency-Inverse Document Frequency)는 TF와 IDF를 곱한 값으로 값이 클수록 어떤 단어가 해당 문서에서 자주 사용되지만 다른 주제의 문서에서는 출현 빈도가 낮아 그 문서에서의 어떤 단어의 중요도를 의미한다[18]. 따라서, 수집된 데이터에서 출현 빈도가 높고 반복적으로 나타나지만 모든 문서에서 빈번히 등장하여 일반적으로 쓰인 단어들을 제거하기 위해 사용한다. 본 연구에서는 선행연구[18]를 참고하여 TF-IDF가 0.5 이하인 단어를 제외어 사전에 포함하고 의미형태소인 2글자 이상의 단어를 정제하여 총 585단어를 추출하였다.

(3) 단어의 빈도와 중심성 분석: 단어의 등장빈도를 파악하기 위해 전체 네트워크에 출현한 단어의 단순 등장빈도와 단어가 출현한 문서 수를 확인하였고, TF-IDF값을 분석하였다. 중심성이 계산되는 네트워크를 만드는 과정에서 단어 간 연결선 및 동시출현을 산출할 때, 문서 단위는 개별 초록으로 지정했다. 주요어들 간의 관계를 파악하기 위해 텍스트네트워크 분석방법을 사용하여 단어 간 동시출현 빈도를 링크로 표현하는 단어 네트워크를 형성하였다. 단어 네트워크를 형성하기 위해 단어-문서 간 2-mode 형태를 단어-단어 간 1-mode 네트워크로 변환하였고, 이를 토대로 연결정도 중심성(degree centrality), 근접 중심성(closeness centrality), 매개 중심성(betweenness centrality)분석을 실시하였다.

(4) 토픽모델링: 토픽모델링은 텍스트 마이닝 분야에서 사용되는 도구로 방대한 문서의 집합에서 유의미한 패턴을 찾아내는 것을 목적으로 한다[13,14]. 토픽은 연관관계가 높은 단어들이 문서에 포함된 확률의 분포이며, 본 연구에서는 문헌의 숨겨진 주제를 찾아내는 알고리즘인 잠재적 디리클레 할당 기법을 이용했는데, 이는 단어와 문서의 분포를 추정하여 해당 문서의 주요 단어와 분류를 모델링하는 것으로[14-16] LDA (Latent dirichlet allocation) 입력 옵션에 대한 선행연구 결과를[17,18] 토대로 기법을 사용하여 MCMC (Markov Chain Monte-Carlo) > alpha 1.44, beta 0.001, no of literation=1,000으로 설정하여 토픽 분석을 실시하였다. 여러 번의 시뮬레이션을 통해 도출된 토픽분석의 결과를 본 연구에 참여하는 연구자 전원이 확인하고 합의를 거쳐 6개의 토픽을 결정하였다. 결정된 토픽들의 주요어를 직관적으로 확인하기 위해 워드 클라우드를 생성하고, 핵심 주제를 파악하기 위해 토픽별로 상위 20개 단어를 추출한 뒤 연결 정도 중심성을 분석하고 토픽-단어 2-mode 네트워크를 이용하여 토픽-키워드 맵으로 시각화했다.

연구 결과

기초 통계

임신성 당뇨와 모유수유에 대한 최근 20년간 문헌은 총 366편으로, 학술지의 유형별로 살펴봤을 때 SCIE와 Scopus가 많았으며(94.5%), 연구의 유형은 조사연구와 실험연구가 62.9%를 차지했다. 연구에서 이용된 주된 분석법은 다변량분석과 단변량분석 방법이 63.1%, 보고서와 메타분석, 체계적 리뷰 등의 분석법이 32.8%로 나타났다. 연도별 발표 논문은 2001년에서 2010년까지 29편(연평균 2.9편), 2011년에서 2020년까지 337편(연평균 33.7편)으로 최근 10년 사이에 11배 이상으로 증가하였다 (Table 1).

Characteristics and Distribution of Researches of GDM and Breastfeeding (N=366)

빈도 분석 및 중심성 분석

추출된 문헌 전체에서 단순 출현 빈도가 높은 단어의 순서는 ‘노출(exposure)’, ‘저혈당(hypoglycemia)’, ‘지지(support)’, ‘지식(knowledge)’, ‘태아(fetus)’로 나타났다. 해당 문헌 내에서의 단어의 중요도를 의미하는 TF-IDF값이 높은 단어의 순서는 ‘정보(information)’, ‘증가(increase)’, ‘지지(support)’, ‘예방(prevention)’, ‘태아(fetus)’로 나타났다(Table 2).

Core Keywords by Frequency, TF-IDF, Degree Centrality, Closeness Centrality, and Betweenness Centrality

본 연구에서 단어 네트워크의 연결 정도 중심성, 근접 중심성, 매개 중심성의 평균은 각각 0.01, 0.02, 0.00이었고, 집중도는 각각 4.3%, 5.7%, 1.8%였다. 연결 정도 중심성은 ‘태아(fetus)’, ‘예방(prevention)’, ‘자간전증(preeclampsia)’, ‘노출(exposure)’, ‘금연(smoking)’의 순서였으며, 근접 중심성은 ‘자간전증(preeclampsia)’, ‘흡연(smoking)’, ‘고혈압(hypertension)’, ‘재태기(gestation)’, ‘노출(exposure)’의 순서로 구성되어 있었고, 매개 중심성은 ‘자간전증(preeclampsia)’, ‘고혈압(hypertension)’, ‘대사질환(metabolic disease)’, ‘노출(exposure)’, ‘태아(fetus)’의 순서로 구성되어 있었다.

세 개의 중심성 분석에서 모두 상위 20위 안에 포함되는 단어는 ‘노출(exposure)’, ‘태아(fetus)’, ‘저혈당(hypoglycemia)’, ‘표식(marker)’, ‘투약(medication)’, ‘대사질환(metabolic disease)’, ‘자간전증(preeclampsia)’, ‘예방(prevention)’, ‘프로그램(program)’, ‘흡연(smoking)’으로 총 10개 단어였다.

이상의 결과와 같이 출현 빈도와 TF-IDF값에 의한 빈도분석의 상위 10위권 단어들과 세 개의 중심성 분석에서 높은 중심성이 나타난 10개의 단어들을 확인하여 ‘노출(exposure)’, ‘태아(fetus)’, ‘저혈당(hypoglycemia)’, ‘예방(prevention)’, ‘프로그램(program)’이 ‘임신성 당뇨와 모유수유’와 연관되어 연구되고 있는 핵심 주요어임을 알 수 있었다. 네트워크의 연결 정도 중심성, 근접 중심성, 매개 중심성 상위 20개의 단어는 Table 2에 나타냈다.

토픽모델링

토픽모델링 분석을 통해 나타난 키워드들을 중심으로 연구자 4인이 해당 문헌의 초록을 읽은 후 연구자들의 합의를 통해 대표하는 주제를 찾고자 하였으며, 분석결과 ‘심혈관 질환’, ‘비만’, ‘합병증 예방전략’, ‘모유수유 지지’, ‘교육 프로그램’, ‘임신성 당뇨 관리’라는 6개 주제가 도출되었다(Table 3).

Topic Group by Topic Modeling (N=366)

주제별로 등장하는 단어들은 단어의 빈도에 따라 워드 클라우드를 시각화(Figure 1)하였고, 각 주제별로 상위 확률에 등장하는 단어들의 키워드 네트워크를 시각화하여 Figure 2에 나타냈다.

Figure 1

Word clouds by topic

Figure 2

Topic-keyword map by two-mode analysis

각각 토픽의 주제는 토픽별 논문 초록에서 등장하는 문장에서의 단어의 쓰임을 확인하여 분류하는 작업을 거쳤다. Topic 1에서는 ‘대사(metabolism)’, ‘메커니즘(mechanism)’, ‘콜레스테롤(cholesterol)’, ‘심혈관계 질환(cardiovascular disease)’, ‘인슐린 저항성(insulin resistance)’이 등장하여 심혈관 질환, 인슐린 저항성, 콜레스테롤의 기전 혹은 신진대사와의 연결성을 나타내어 ‘심혈관 질환’이라 명명하였다. Topic 2에서는 ‘노출(exposure)’, ‘임신 시 체중(gestational weight)’, ‘아동비만(childhood obesity)’, ‘비만(adiposity)’, ‘임신(pregnancy)’의 단어가 등장하여 임신성 당뇨가 모성 비만과 어린이 비만에 영향을 미치는 임신 관련 문제에 대한 연관이 나타나 ‘비만’으로 명명하였다. Topic 3에서는 ‘스크리닝(screening)’, ‘신체활동(physical activity)’, ‘예방(prevention)’, ‘신체(body)’, ‘고혈압(hypertension)’이 등장했다. 이는 선별검사와 신체적 활동을 통한 고혈압과 같은 임신성 당뇨 합병증 예방에 관한 내용을 나타내므로 ‘합병증 예방전략’이라 명명하였다. Topic 4에서는 ‘지식(knowledge)’, ‘지지(support)’, ‘음식(food)’, ‘아기(baby)’, ‘경험(experience)’ 단어가 등장하며 모유수유와 관련된 지지와 지식, 경험에서 단어의 연관성이 나타나 ‘모유수유 지지’로 명명하였다. Topic 5에서는 ‘퇴원(discharge)’, ‘제왕절개(cesarean section)’, ‘우울(depression)’, ‘증상(symptom)’, ‘프로그램(program)’의 단어가 등장하며 제왕절개 분만과 퇴원, 산후 우울증, 관련 프로그램의 필요성이 언급되어 ‘교육 프로그램’으로 명명하였다. Topic 6에서는 ‘저혈당(hypoglycemia)’, ‘섭취(intake)’, ‘투약(medication)’, ‘재태기(gestation)’, ‘증가(increase)’가 등장하여 저혈당과 음식, 투약 및 재태기간 간의 관련성을 보여주므로 ‘임신성 당뇨 관리’라고 최종 명명하였다.

논 의

본 연구에서는 텍스트네트워크 분석과 토픽모델링 기법을 이용하여 최근 20년간 국내외에서 시행된 임신성 당뇨와 모유수유 관련 연구들의 초록에 포함된 키워드를 분석함으로써, 관련 연구들의 핵심 단어를 도출하고 주요 연구 동향을 파악하였다. 도출된 연구결과를 바탕으로 임신성 당뇨 산모의 모유수유를 돕기 위한 적극적이고 효과적인 간호 중재의 전략을 세우는데 도움이 될 추후 연구방향을 제시하고자 한다. 검색을 통해 추출된 논문에서 국내 논문은 3편에 해당하였는데, 임신성 당뇨나 모유수유에 대한 연구가 각각의 주제로는 많이 이루어져 왔으나 임신성 당뇨와 모유수유를 함께 이루어진 연구가 부족한 실정임을 알 수 있다. 조건에 따라 선정된 논문이 발표된 연도별 편수를 살펴보면 2001년에서 2010년까지 연평균 2.9편에 해당하였으나 2011년 16편으로 5배 이상의 증가가 있은 후 2020년까지 321편이 출판되어 급격한 증가를 나타내고 있다. 이는 늦은 결혼과 고령 산모의 증가로 인한 고위험 산모 및 출생아의 건강문제에 대한 관심이 증가하면서 임신성 당뇨와 모유수유와 관련된 연구가 증가하고 있는 것으로 여겨진다. 텍스트네트워크 분석을 통해 단어의 출현 빈도와 연

결 중심성, 근접 중심성, 매개 중심성을 분석한 결과 ‘노출’, ‘태아’, ‘저혈당’, ‘예방’, ‘프로그램’이 핵심 단어로 도출되었는데, 임신성 당뇨에 노출된 태아는 과체중아나 거대아로 태어나기 쉽고, 태어난 후에는 저혈당의 발생이 높으며 비만, 소아 당뇨병 등으로 진행될 확률이 크기에 이들에 대한 연구가 이루어졌음을 알 수 있다[19-22]. 또한 임신성 당뇨 산모도 조산과 난산과 같은 분만 중 합병증이나 분만 후에 제2형 당뇨병으로 진행될 가능성이 높기에, 분만 후 적절한 혈당조절을 통해 합병증을 예방하는 중재의 필요성에 대한 연구가 진행되었음을 보여준다[23,24]. 모유수유는 임신성 당뇨 산모의 혈당을 조절하여 산모와 아이에게 발생할 수 있는 합병증을 감소시킬 수 있는 방법이기에 모유수유증진 프로그램과 임신성 당뇨를 관리하는 프로그램 등과 같은 중재들에 대한 제시도 활발히 이루어졌음을 알 수 있다[23,24].

임신성 당뇨와 모유수유에 관련된 연구들의 동향을 파악하기 위해 토픽모델링을 실시한 결과 ‘심혈관 질환’, ‘비만’, ‘합병증 예방전략’, ‘모유수유 지지’, ‘임신성 당뇨관리’, ‘교육 프로그램’이라는 6개의 토픽이 추출되었다. 토픽모델링에서 추출된 6개 토픽의 등장확률을 살펴보면 ‘심혈관 질환’과 ‘비만’, ‘합병증 예방전략’, ‘모유수유 지지’가 17~20%를 차지하여, 최근 20년 동안 임신성 당뇨와 관련 질환, 합병증 예방, 모유수유 지지 필요성에 대한 연구가 주로 이루어져 왔다고 할 수 있다. 상대적으로 등장확률이 적은 ‘임신성 당뇨 관리’와 ‘교육 프로그램’ 관련 연구는 간호사의 역할과 관련이 높은 주제로 간호 분야에서 향후 더 발달될 여지가 있음을 알 수 있다.

토픽 ‘임신성 당뇨와 심혈관 질환의 관계’에서는 ‘대사’, ‘기전’, ‘콜레스테롤’ 등이 주요 키워드로 등장하며, 토픽 ‘임신성 당뇨와 비만’에서는 ‘노출’, ‘임신 중 체중’, ‘소아비만’ 등이 주요 키워드로 나타난다. 엄마가 임신성 당뇨인 상태에서 태어난 아동이 그렇지 않은 경우보다 과체중이나 비만 아동이 될 가능성이 1세에 1.5배, 2세에 2.8배, 3세에는 3.3배로 유의하게 높았고[25], 9-11세 아동을 대상으로 한 연구에서도 아동이 비만이 될 확률이 임신성 당뇨 산모의 자녀에서 그렇지 않은 경우보다 1.73배나 높게 나타났다[26]. 국내 18세 이하 소아 청소년기 제2형 당뇨병 환자 수가 2006년 약 12,000명에서 2013년 약 16,000명으로 30% 이상 증가하였고, 소아 청소년을 포함한 젊은 연령에서 제2형 당뇨병이 제1형 당뇨병보다 더욱 급격하게 증가하는 경향을 보이는 것은 비만인구의 증가와 밀접한 관련이 있으며, 아시아권에서는 전체 소아 청소년 당뇨병의 약 20% 정도가 제2형 당뇨병으로 알려져 있을 만큼 소아 청소년의 제2형 당뇨, 비만은 심각한 건강 위협 요인이다[27]. 이와 같이 소아 청소년 당뇨와 비만은 성인병인 고혈압과 콜레스테롤, 심혈관계 질환을 야기하는 주요 요인으로 여겨지며 이러한 위험요인을 관리하기 위한 포괄적인 접근이 시급하다.

‘합병증 예방전략’에 등장하는 주요 키워드는 ‘스크리닝’, ‘신체활동’, ‘고혈압’ 등이며, 토픽 ‘임신성 당뇨와 모유수유 지지’에 등장하는 주요 키워드는 ‘지식’, ‘지지’, ‘경험’ 등으로 임신성 당뇨 합병증의 예방과 사회적 영향을 줄이기 위해 선별검사와 신체활동 및 모유수유 지지의 중요성이 언급되고 있다[28]. 2019년 대한당뇨학회에서 발표한 당뇨병 진료지침에서는 임신성 당뇨 여성의 혈당조절을 위해 당화혈색소를 2~3개월마다, 자가 혈당 측정은 매 식사 전후, 취침 전, 새벽, 운동 전후, 저혈당 시에 측정하도록 권고하고 있으며[29] 임신성 당뇨에서 제2형 당뇨병으로의 진행을 예방하기 위해 신체활동 증가를 포함한 생활습관 교정과 혈당 관리가 필요함을 강조하고 있다. 임신성 당뇨 임부의 혈당 관리는 대부분 산전관리에서 이루어지고 있는데, 임부의 특성과 상황을 고려한 자가 혈당 측정 현황, 신체활동 처방 및 이행에 대한 연구가 필요하다고 생각된다. 모유수유는 임신성 당뇨 산모와 아이에게서 제2형 당뇨병의 후속 위험과 더불어 소아비만 발생을 감소시키며 안전하면서 실현 가능한 저비용의 방법을 제공하기 때문에 임신성 당뇨 산모에게 산전교육부터 강조되어야 한다[28].

향후 임신성 당뇨와 모유수유에 대한 연구가 더욱 이루어질 여지가 있는 토픽 ‘임신성 당뇨 관리’에 등장하는 주요 키워드는 ‘저혈당’, ‘섭취’, ‘투약’이며, 토픽 ‘교육 프로그램’의 주요 키워드는 ‘퇴원’, ‘제왕절개’, ‘우울’, ‘증상’ 등으로 나타난다. 임신성 당뇨 산모는 임신 중기와 말기에 발생한 고혈당으로 태아성장이 촉진되어 거대아, 과체중아를 분만하게 될 확률이 높아 제왕절개분만을 선택하게 될 가능성이 높고, 임신으로 야기된 당뇨의 관리에 대한 새로운 지식을 습득해야 하는 어려움에 직면한다. 임신성 당뇨 산모들은 병원에서 퇴원하면서 출산 전후 건강한 식단과 신체활동에 대한 권장사항을 잘 따르지 못하는 경향이 있고, 일상적인 실제 환경에서 건강 행동의 변화가 지속되는데 어려움을 겪으므로[30], 산후 우울로 이환될 가능성이 높다. 이러한 현상은 산전관리와 분만과정에서는 전문기관의 도움을 받지만 퇴원하면서 가정에서 산후 당뇨관리와 아이양육의 일차적 책임을 지는 산모가 관리에 대한 지식과 지지체계가 부족할 때 부담이 증가하면서 두드러지게 된다. 개인의 부담을 완화하고 임신성 당뇨 산모와 아이의 삶의 질을 개선하기 위해 관리에 대한 교육프로그램과 지지자원의 개발 등 개인, 가족, 사회, 건강 시스템 측면에서 다각적인 해결방안이 필요할 것으로 사료된다.

임신기간, 출산 후 건강에 취약한 임신성 당뇨 산모에게 모유수유의 지원은 합병증 예방과 출생 아동의 성장발달을 도와 대상자의 건강을 이룰 뿐만 아니라 지역사회 보건의료서비스의 질향상의 결과로 이어진다. 임신성 당뇨와 같은 고위험 산모와 아이의 건강증진 노력에는 질병의 대사 기전과 합병증, 관련 질환과 예방을 위한 건강행위의 철저한 이해를 기반으로 하여야 하며, 이는 개인의 건강행위에 대한 신념과 의지, 가족과 사회의 지지, 경제적 어려움에 대한 건강 시스템의 지원 등이 필요하므로 이러한 다각적인 방면의 해결방안을 마련하기 위해 신중하게 임신성 당뇨 산모에게 맞춤형 모유수유 프로그램이 제공되어야 할 것으로 사료된다.

구체적인 중재로 임신성 당뇨 산모의 모유수유는 초기의 적극적인 개입과 지속으로 성공여부가 결정되므로 유방의 관리법, 모유수유 효과와 방법에 대한 홍보와 교육, 지지 체계의 제공, 모유수유 지원에 대한 정부 차원의 지역사회 보건의료서비스를 위한 관련 지침과 연구가 필요하다. 나아가 체계적인 지지, 정책을 효과적으로 수행하기 위해 모유수유의 수행 의도에 영향을 미치는 자기 효능감을[13] 향상시키는 모유수유 증진 프로그램의 개발 연구를 제언한다.

텍스트네트워크 분석은 비정형화된 텍스트에서 구조화된 패턴 정보를 추출하고 의미가 있는 연관구조에 초점을 맞춤으로써 전통적 내용 분석을 향상시킬 수 있지만, 분석 대상의 주제 문헌 집단을 어떻게 선정하느냐에 따라 추출되는 키워드 양의 변화가 생길 수 있다. 따라서, 추후 관련 연구에서 핵심 단어를 통한 연구 문제의 발견과 의미 있는 주제를 선정하기 위한 반복적인 연구를 제언한다. 또한 연구동향에서 살펴본 바와 같이 임신성 당뇨의 합병증을 예방하고 모유수유를 증진하기 위해서는 임신성 당뇨 산모에게 산전교육을 통하여 모유수유와 소아비만에 대한 정보를 제공하고, 산후 모유수유에 대한 교육과 훈련, 지역사회 지지 프로그램 등과 같이 다각적인 노력이 필요하며, 시간이 흐를수록 모유수유율은 감소하기에 출산 후 시기별 맞춤형 접근에 관한 연구도 요구된다. 간호사는 임신성 당뇨 산모에게 당뇨 관리와 모유수유 관련 정보를 제공하고 지지자원을 연계하여 임신성 당뇨 산모의 합병증을 예방하고 모유수유를 증진시키는데 기여하는 중요한 자원이다. 따라서, 예비 간호사인 간호대학생에게 임신성 당뇨와 모유수유 증진에 대한 필요성을 인식시키고 이에 대한 정보를 간호교육 과정을 통해 제공할 필요성이 있으며, 이는 추후 간호현장에서 간호사가 대상자들에게 교육과 지지를 통해 임신성 당뇨의 합병증을 줄이고 모유수유 증진을 향상시키는데 기여할 수 있을 것으로 사료된다.

결론 및 제언

본 연구는 텍스트네트워크 분석과 토픽모델링을 활용하여 임신성 당뇨와 모유수유 관련 연구의 동향을 제시하고 향후 연구 주제의 개발과 임신성 당뇨와 모유수유에 관한 세부 교육프로그램과 지지자원 주제의 개발에 기초자료로 활용될 수 있다는 점에서 연구의 의의가 있다. 임신성 당뇨 산모가 증가하고 임신성 당뇨에 대한 모유수유의 중요성이 부각되고 있음에도 임신성 당뇨와 모유수유에 대한 국내 연구는 부진한 실정이며, 추후 임신성 당뇨와 모유수유 관련 연구가 많이 이루어져야 하겠다. 본 연구를 통해 최근 20년간 임신성 당뇨와 모유수유 연구의 핵심 단어는 ‘노출’, ‘태아’, ‘저혈당’, ‘예방’, ‘프로그램’으로 나타났다. 토픽모델링을 통해 확인된 주제는 ‘심혈관 질환’, ‘비만’, ‘합병증 예방전략’, ‘모유수유 지지’, ‘임신성 당뇨 관리’ 및 ‘교육 프로그램’으로 명명되었으며, 임신성 당뇨와 모유수유 관련 연구는 심혈관 질환이나 비만과 같은 합병증과 관련하여 연구가 많이 이루어졌음을 알 수 있다. 6개의 토픽 중 ‘임신성 당뇨관리’와 ‘교육 프로그램’은 가장 낮은 비율로 나타났으며, 이들 주제는 간호사의 역할과 관련이 높은 주제로 간호분야에서 이와 관련하여 많은 연구가 이루어질 필요가 있다. 임신성 당뇨의 합병증을 예방하고 모유수유를 증진하기 위해서는 임신성 당뇨관리와 교육프로그램 개발을 포함하는 다양한 간호 중재가 개발되어야 하겠다.

Notes

Conflict of interest

No potential conflict of interest relevant to this article was reported.

Funding

This research was supported by the Basic Science Research Program through the National Research Foundation of Korea (NRF) funded by the Ministry of Education (NRF-2019R1I1 A3A01059963).

Acknowledgements

None

Supplementary materials

None

References

1. Statistics Korea. 2019 life tables for Korea [Internet] Seoul: Statistics Korea; 2020. [cited 2020 August 26]. Available from:http://kostat.go.kr/assist/synap/preview/skin/doc.html?fn=synapview384631_4&rs=/assist/synap/preview.
2. International Diabetes Federation. IDF DIABETES ATLAS Ninth edition 2019 [Internet] Brussels: International Diabetes Federation; 2019. [cited 2020 June 1]. Available from:https://diabetesatlas.org/upload/resources/material/20200302_133351_IDFATLAS9e-final-web.pdf.
3. Much D, Beyerlein A, Roßbauer M, Hummel S, Ziegler A. Beneficial effects of breastfeeding in women with gestational diabetes mellitus. Molecular Metabolism 2014;3(3):284–292. https://doi.org/10.1016/j.molmet.2014.01.002.
4. Pedersen J. Weight and length at birth of infants of diabetic mothers. European Journal of Endocrinology 1954;16(4):330–342. https://doi.org/10.1530/acta.0.0160330.
5. Barker DJ, Osmond C. Infant mortality, childhood nutrition, and ischemic heart disease in England and Wales. Lancet 1986;327(8489):1077–1081. https://doi.org/10.1016/S0140-6736(86)91340-1.
6. Kim HR. Breastfeeding trends, affecting factors and policy options for breastfeeding promotion in Korea. Health and Welfare Policy Forum 2013;201:49–60.
7. Young M, Wolfheim C, Marsh DR, Hammamy D. World Health Organization/United Nations Children's Fund joint statement on integrated community case management:an equity-focused strategy to improve access to essential treatment services for children. American Journal of Tropical Medicine &Hygiene 2012;87(5 Suppl):6–10. https://doi.org/10.4269/ajtmh.2012.12-0221.
8. Ha BM, Kim SH. Exclusive breastfeeding rates and it's influencing factors by the 1st and 6th month of postpartum. The Journal of the Korea Contents Association 2018;18(5):230–240. https://doi.org/10.5392/JKCA.2018.18.05.230.
9. Stuebe AM, Bonuck K, Adatorwovor R, Schwartz TA, Berry DC. A cluster randomized trial of tailored breastfeeding support for women with gestational diabetes. Breastfeeding Medicine 2016;11(10):504–513. https://doi.org/10.1089/bfm.2016.0069.
10. Horta BL, de Lima NP. Breastfeeding and type 2 diabetes:systematic review and meta-analysis. Current Diabetes Reports 2019;19(1):1–6. https://doi.org/10.1007/s11892-019-1121-x.
11. Nguyen PTH, Pham NM, Chu KT, Van Duong D, Van Do D. Gestational diabetes and breastfeeding outcomes:a systematic review. Asia Pacific Journal of Public Health 2019;31(3):183–198. https://doi.org/10.1177/1010539519833497.
12. Park SM, Min DL, Park JY. The influence of knowledge and health beliefs about gestational diabetes on breastfeeding intention of women with gestational diabetes. Journal of Korean Academy of Community Health Nursing 2020;31(4):427–435. http://doi.org/10.12799/jkachn.2020.31.4.427.
13. Aggarwal CC. An introduction to social network data analytics. |eIn:Aggarwal CC, editor. Social network data analytics Boston: Springer; 2011. p. 1–15. https://doi.org/10.1007/978-1-4419-8462-3_1.
14. Greene D, O'Callaghan D, Cunningham P. How many topics?stability analysis for topic models. |eIn:Calders T, Esposito F, Hullermeier E, Meo R, editors. Machine learning and knowledge discovery in databases Berlin, Heidelberg: Springer; 2014. p. 498–513. https://doi.org/10.1007/978-3-662-44848-9_32.
15. Lee SS. A content analysis of journal articles using the language network analysis methods. Journal of the Korean Society for Information Management 2014;31(4):49–68. https://doi.org/10.3743/KOSIM.2014.31.4.049.
16. Park EJ, Kim YJ, Park CS. A comparison of hospice care research topics between Korea and other countries using text network analysis. Journal of Korean Academy of Nursing 2017;47(5):600–612. https://doi.org/10.4040/jkan.2017.47.5.600.
17. Lee SS. A study on the application of topic modeling for the book report text. Journal of Korean Library and Information Science Society 2016;47(4):1–18. https://doi.org/10.16981/kliss.47.4.201612.1.
18. Griffiths TL, Steyvers M. Finding scientific topics. Proceedings of the National Academy of Science 2004;101(Suppl 1):5228–5235. https://doi.org/10.1073/pnas.0307752101.
19. Silva MDB, Oliveira RVC, Braga JU, Almeida JAG, Melo ECP. Breastfeeding patterns in cohort infants at a high-risk fetal, neonatal and child referral center in Brazil:a correspondence analysis. BMC Pediatrics 2020;20:372–384. https://doi.org/10.1186/s12887-020-02272-w.
20. Rosenbauer J, Herzig P, Giani G. Early infant feeding and risk of type 1 diabetes mellitus—a nationwide population-based case–control study in pre-school children. Diabetes/ Metabolism Research and Reviews 2008;24(3):211–222. https://doi.org/10.1002/dmrr.791.
21. Bernstein JA, McCloskey L, Gebel CM, Iverson RE, Lee-Parritz A. Lost opportunities to prevent early onset type 2 diabetes mellitus after a pregnancy complicated by gestational diabetes. BMJ Open Diabetes Research and Care 2016;4(1):e000250. http://doi.org/10.1136/bmjdrc-2016-000250.
22. Halipchuk J, Temple B, Dart A, Martin D, Sellers EA. Prenatal, obstetric and perinatal factors associated with the development of childhood-onset type 2 diabetes. Canadian Journal of Diabetes 2018;42(1):71–77. https://doi.org/10.1016/j.jcjd.2017.04.003.
23. Abuelezam NN, Cuevas AG, Galea S, Hawkins SS. Maternal health behaviors and infant health outcomes among Arab American and non-Hispanic white mothers in Massachusetts, |y2012-2016. Public Health Reports 2020;135(5):658–667. http://doi.org/10.1177/0033354920941146.
24. Hui LL, Li AM, Nelson EAS, Leung GM, Lee SL, Schooling CM. In utero exposure to gestational diabetes and adiposity:does breastfeeding make a difference. International Journal of Obesity 2018;42(7):1317–1325. https://doi.org/10.1038/s41366-018-0077-2.
25. Cuneyt A, Sabri C, Kerem U, Gorsel S, Teslime A, Gokhan T. Maternal gestational diabetes and early childhood obesity:a retrospective cohort study. Childhood Obesity 2020;16(8):579–585. http://doi.org/10.1089/chi.2020.0183.
26. Zhao P, Liu E, Qiao Y, Peter TK, Jean-Philippe C, Mikael F, et al. Maternal gestational diabetes and childhood obesity at age 9–11:results of a multinational study. Diabetologia 2016;59:2339–2348. https://doi.org/10.1007/s00125-016-4062-9.
27. Lee KA. Management of type 2 diabetes mellitus in adolescents and young adults. Journal of Korean Diabetes 2020;21(1):6–10. https://doi.org/10.4093/jkd.2020.21.1.6.
28. Bider-Canfield Z, Martinez MP, Wang X, Yu W, Bautista MP, Brookey J, et al. Maternal obesity, gestational diabetes, breastfeeding and childhood overweight at age 2 years. Pediatric Obesity 2017;12:171–178. https://doi.org/10.1111/ijpo.12125.
29. Korean Diabetes Association. Treatment guideline for diabetes 2019 [Internet] Seoul: Korean Diabetes Association; 2019. [cited 2019 June 21]. Available from:https://www.diabetes.orakr/pro/publish/guide.php?code=guide&year_v=|y2019&mode=view&number=735.
30. Nielsen KK, Dahl-Petersen IK, Jensen DM, Overson P, Damm P, Jensen NH, et al. Protocol for a randomized controlled trial of a co-produced, complex, health promotion intervention for women with prior gestational diabetes and their families:the Face-it study. Trials 2020;21(146):1–12. https://doi.org/10.1186/s13063-020-4062-4.

Article information Continued

Table 1

Characteristics and Distribution of Researches of GDM and Breastfeeding (N=366)

Categories n (%)
Type of research Survey 140 (38.3)
Qualitative study 11 (3.0)
Experimental study 90 (24.6)
Program development 10 (2.7)
Miscellaneous (concept analysis, systematic review, methodological study) 115 (31.4)
Analysis method Multivariate analysis 152 (41.5)
Univariate analysis 79 (21.6)
Qualitative research method 15 (4.1)
Others (hybrid model, meta-analysis, report, assessment tool development) 120 (32.8)
Publication year 2001-2010 29 (7.9)
2011-2015 96 (26.3)
2016-2020 241 (65.8)

GDM=gestational diabetes mellitus

Table 2

Core Keywords by Frequency, TF-IDF, Degree Centrality, Closeness Centrality, and Betweenness Centrality

Rank Keyword

Frequency TF-IDF Degree centrality Closeness centrality Betweenness centrality
1 exposure information fetus preeclampsia preeclampsia
2 hypoglycemia increase prevention smoking hypertension
3 support support preeclampsia hypertension metabolic disease
4 knowledge prevention exposure gestation exposure
5 fetus fetus smoking exposure fetus
6 discharge exposure physical activity fetus cardiovascular disease
7 cesarean section complication metabolic disease prevention smoking
8 food gestation hypoglycemia metabolic disease prevention
9 increase strategy circumference family gestation
10 intake program support adiposity marker
11 program family supplement pattern metabolism
12 gestation gestational age sex cardiovascular disease hypoglycemia
13 information characteristic safety neonate adiposity
14 body cesarean section program complication program
15 family formula metabolism baby medication
16 gestational age physical activity medication program supplement
17 formula need maternal age medication safety
18 prevention maternal age material hypoglycemia sex
19 physical activity food marker incidence maternal age
20 screening behavior intake marker physical activity

TF-IDF=term frequency-inverse document frequency

Table 3

Topic Group by Topic Modeling (N=366)

Topic group Cardiovascular disease Obesity Complication prevention strategy Support of breastfeeding Educational program Management of GDM
No. of articles (%) 73 (20) 67 (18) 62 (17) 62 (17) 58 (16) 44 (12)
Rank of keyword metabolism exposure screening knowledge discharge hypoglycemia
mechanism gestational weight physical activity support cesarean section intake
cholesterol childhood obesity prevention food depression medication
cardiovascular disease adiposity body baby symptom gestation
insulin resistance pregnancy hypertension experience program increase

GDM=gestational diabetes mellitus

Figure 1

Word clouds by topic

Figure 2

Topic-keyword map by two-mode analysis