본문으로 이동
주 메뉴
주 메뉴
사이드바로 이동
숨기기
둘러보기
대문
최근 바뀜
요즘 화제
임의의 문서로
sitesupport
사용자 모임
사랑방
사용자 모임
관리 요청
편집 안내
소개
도움말
정책과 지침
질문방
한울위키
검색
검색
보이기
로그인
개인 도구
로그인
자료 문서 원본 보기
문서
토론
한국어
읽기
원본 보기
역사 보기
도구
도구
사이드바로 이동
숨기기
동작
읽기
원본 보기
역사 보기
일반
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
보이기
사이드바로 이동
숨기기
←
자료
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
일반 사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{다른 뜻 넘어옴|데이터|컴퓨터 과학 용어|데이터 (컴퓨팅)}} [[파일:Data types - en.svg|섬네일|오른쪽|200px|지리, 문화, 과학, 금융, 통계, 기상, 자연, 운송 등 다양한 유형의 자료]] {{인식론 사이드바}} '''자료'''(資料, {{lang|en|data}}, 데이터, {{문화어|데타}})는 [[정보]]를 전달하는 불연속 또는 연속적인 [[값 (기호학)|값]]의 모음으로, [[양 (크기)|양]], [[질적 속성|질]], [[사실]], [[통계학|통계]], 기타 기본적인 의미 단위 또는 단순히 추가적으로 [[해석 (논리)|형식적]]으로 해석될 수 있는 [[상징|기호]]의 시퀀스를 설명한다. '''데이텀'''(datum)은 자료 모음의 개별적인 값이다. 자료는 일반적으로 추가적인 [[맥락]]과 의미를 제공하는 [[표]]와 같은 [[자료 구조|구조]]로 조직되며, 더 큰 구조에서 자료로 사용될 수 있다. 자료는 [[데이터 (컴퓨팅)|컴퓨팅 프로세스]]의 [[변수 (연구)|변수]]로 사용될 수 있다.<ref name=":0">{{서적 인용|title=OECD Glossary of Statistical Terms |url=https://archive.org/details/oecdglossaryofst0000unse |page=[https://archive.org/details/oecdglossaryofst0000unse/page/n120 119] |date=2008 |publisher=OECD |isbn=978-92-64-025561}}</ref><ref>{{웹 인용|url=https://abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+what+are+data |title=Statistical Language - What are Data? |date=2013-07-13 |website=Australian Bureau of Statistics |access-date=2020-03-09 |url-status=live |archive-url=https://web.archive.org/web/20190419010315/http://abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+what+are+data |archive-date=2019-04-19}}</ref> 자료는 추상적인 아이디어 또는 구체적인 측정값을 나타낼 수 있다.<ref>{{웹 인용|url=https://diffen.com/difference/Data_vs_Information|title=Data vs Information - Difference and Comparison {{!}} Diffen|website=www.diffen.com|language=en|access-date=2018-12-11}}</ref> 자료는 일반적으로 [[과학 연구]], [[경제학]] 및 거의 모든 형태의 인간 조직 활동에 사용된다. 자료 집합의 예시로는 [[소비자 물가지수]]와 같은 물가 지수, [[실업률]], [[문해]]율 및 [[인구 조사]] 자료 등이 있다. 이러한 맥락에서 자료는 유용한 정보를 추출할 수 있는 원시적인 사실과 수치를 나타낸다. 자료는 [[측정]], [[관측]], [[정보 검색]], 또는 [[분석]]과 같은 기술을 사용하여 [[데이터 보고|수집]]되며, 일반적으로 [[지식 표현|숫자]] 또는 [[문자 (컴퓨팅)|문자]]로 [[표현]]되며 추가적으로 [[데이터 처리|처리]]될 수 있다. [[현장 조사|현장 자료]]는 통제되지 않은 [[현장]] 환경에서 수집된 자료이다. [[실험 자료]]는 통제된 [[과학]] 실험 과정에서 생성된 자료이다. 자료는 [[데이터 분석|계산]], [[이성]], 토론, [[프레젠테이션]], [[데이터 시각화|시각화]] 또는 기타 형태의 사후 분석과 같은 기술을 사용하여 분석된다. 분석 전에 [[미가공 데이터|원시 자료]] (또는 미처리 자료)는 일반적으로 정제된다. 즉, [[이상치]]가 제거되고 명백한 기기 또는 자료 입력 오류가 수정된다. 자료는 계산, 추론 또는 토론의 기초로 사용될 수 있는 가장 작은 단위의 사실적 정보로 볼 수 있다. 자료는 추상적인 아이디어에서 구체적인 측정값에 이르기까지 다양하며, [[통계량|통계]]를 포함하지만 이에 국한되지 않는다. 관련 맥락에서 제시된 주제적으로 연결된 자료는 정보로 볼 수 있다. 맥락적으로 연결된 정보 조각들은 자료 통찰력 또는 지능으로 설명될 수 있다. 자료를 정보로 종합하여 시간이 지남에 따라 축적되는 통찰력과 지능의 재고는 지식으로 설명될 수 있다. 자료는 "[[디지털 경제]]의 새로운 [[석유]]"로 묘사되어 왔다.<ref>{{잡지 인용|url=https://wired.com/insights/2014/07/data-new-oil-digital-economy/|title=Data Is the New Oil of the Digital Economy|first=Joris |last=Toonders |magazine=Wired|date=July 23, 2014 |url-status=dead |archive-url=https://web.archive.org/web/20240627053345/https://wired.com/insights/2014/07/data-new-oil-digital-economy/ |archive-date= Jun 27, 2024 }}</ref><ref>{{웹 인용|url=https://spotlessdata.com/blog/data-new-oil|title=Data is the new oil|website=Spotless Data |archive-url=https://web.archive.org/web/20180716224058/https://spotlessdata.com/blog/data-new-oil|archive-date=2018-07-16}}</ref> 일반적인 개념으로서 자료는 기존의 [[정보]] 또는 [[지식]]이 더 나은 사용 또는 [[데이터 처리|처리]]에 적합한 형태로 [[지식 표현|표현]]되거나 부호화된다는 사실을 나타낸다. 컴퓨팅 기술의 발전은 일반적으로 페타바이트 규모의 매우 많은 양의 자료를 의미하는 [[빅 데이터]]의 출현으로 이어졌다. 전통적인 자료 분석 방법과 컴퓨팅으로는 이러한 거대한 (그리고 성장하는) 자료 집합을 다루는 것이 어렵거나 심지어 불가능하다. (이론적으로 말하면, 무한한 자료는 무한한 정보를 산출하며, 이는 통찰력이나 지능을 추출하는 것을 불가능하게 만든다.) 이에 대응하여, 비교적 새로운 분야인 [[데이터 과학]]은 [[기계 학습]] (및 기타 [[인공지능]]) 방법을 사용하여 빅 데이터에 분석 방법을 효율적으로 적용할 수 있도록 한다. == 어원 및 용어 == [[라틴어]] 단어 {{Lang|la|data}}는 {{Lang|la|datum}}, 즉 "(주어진) 것"의 복수형이며, "주다"를 뜻하는 {{Lang|la|dare}}의 중성 과거분사이다.<ref name="EOL"/> "data"라는 단어가 영어에서 처음 사용된 것은 1640년대이다. "data"라는 단어는 1946년에 "전송 가능하고 저장 가능한 컴퓨터 정보"를 의미하는 데 처음 사용되었다. "data processing"이라는 표현은 1954년에 처음 사용되었다.<ref name="EOL">{{웹 인용|url=https://etymonline.com/word/data|title=data | Origin and meaning of data |website=Online Etymology Dictionary }}</ref> "data"가 "정보"의 동의어로 더 일반적으로 사용될 때는 단수 형태로 [[불가산 명사]]로 취급된다. 이러한 용법은 [[일상어]]와 [[소프트웨어 개발]] 및 [[컴퓨터 과학]]과 같은 기술 및 과학 분야에서 흔하다. 이러한 용법의 한 예시는 "[[빅 데이터]]"라는 용어이다. 자료 집합의 처리 및 분석을 더 구체적으로 지칭하는 데 사용될 때는 이 용어가 복수형을 유지한다. 이러한 용법은 자연 과학, 생명 과학, 사회 과학, 소프트웨어 개발 및 컴퓨터 과학에서 흔하며, 20세기와 21세기에 인기가 증가했다. 일부 스타일 가이드는 이 용어의 다른 의미를 인식하지 못하고 단순히 가이드의 대상 독자에게 가장 적합한 형태를 권장한다. 예를 들어, 7판 기준의 [[APA 스타일]]은 "data"를 복수형으로 취급하도록 요구한다.<ref>{{서적 인용|author=American Psychological Association |section=6.11 |title=Publication Manual of the American Psychological Association: the official guide to APA style |publisher=American Psychological Association |year=2020 |isbn=9781433832161 }}</ref> == 의미 == [[파일:Philosophical_Transactions_-_Volume_001.djvu|섬네일|오른쪽|page=60|[[아드리앵 오주]]의 "대물렌즈 조리개표"([[:s:Philosophical Transactions/Volume 1/Number 4#56|1665년 필로소피컬 트랜잭션스 기사]]에서 발췌)]]{{참고|DIKW 피라미드}} 자료, [[정보]], [[지식]], [[지혜]]는 밀접하게 관련된 개념이지만, 각각은 다른 개념에 대한 고유한 역할을 가지며 각 용어는 고유한 의미를 가진다. 일반적인 관점에 따르면 자료는 수집되고 분석된다. 자료는 어떤 방식으로든 분석되어야만 의사 결정을 위한 적절한 정보가 된다.<ref>{{웹 인용|title=Joint Publication 2-0, Joint Intelligence|url=https://jcs.mil/Portals/36/Documents/Doctrine/pubs/jp2_0.pdf|work=Joint Chiefs of Staff, Joint Doctrine Publications|publisher=Department of Defense|access-date=July 17, 2018|pages=I-1|date=23 October 2013|archive-date=18 July 2018|archive-url=https://web.archive.org/web/20180718055308/http://www.jcs.mil/Portals/36/Documents/Doctrine/pubs/jp2_0.pdf|url-status=dead}}</ref> 자료 집합이 어떤 사람에게 얼마나 유용한지는 그 사람이 그것을 얼마나 예상하지 못했는지에 달려 있다고 말할 수 있다. 자료 스트림에 포함된 정보의 양은 [[섀넌 엔트로피]]로 특징지어질 수 있다. [[지식]]은 어떤 실체가 자신의 환경에 대해 가지고 있는 인식이지만, 자료는 단순히 그 지식을 전달한다. 예를 들어, [[에베레스트산]]의 높이를 지정하는 데이터베이스의 항목은 정확하게 측정된 값을 전달하는 자료이다. 이 측정값은 에베레스트산에 대한 다른 자료와 함께 책에 포함되어 산을 오르는 최선의 방법을 결정하려는 사람들에게 유용한 방식으로 산을 설명할 수 있다. 이 자료로 표현된 특성에 대한 인식은 지식이다. 자료는 종종 가장 추상성이 적은 개념으로, 정보는 그 다음으로, 지식은 가장 추상적인 개념으로 간주된다.<ref>{{웹 인용|author=Akash Mitra|year=2011|title=Classifying data for successful modeling|url=https://dwbi.org/data-modelling/dimensional-model/16-classifying-data-for-successful-modeling|access-date=2017-11-05|archive-date=2017-11-07|archive-url=https://web.archive.org/web/20171107030817/https://dwbi.org/data-modelling/dimensional-model/16-classifying-data-for-successful-modeling|url-status=dead}}</ref> 이러한 관점에서 자료는 해석을 통해 정보가 된다. 예를 들어, 에베레스트산의 높이는 일반적으로 "자료"로 간주되고, 에베레스트산의 지질학적 특성에 대한 책은 "정보"로 간주될 수 있으며, 에베레스트산 정상에 도달하는 최선의 방법에 대한 실용적인 정보를 포함하는 등반가 가이드북은 "지식"으로 간주될 수 있다. "정보"는 일상적인 용법에서 기술적인 용법에 이르기까지 다양한 의미를 지닌다. 그러나 이러한 관점은 자료가 정보에서, 정보가 지식에서 어떻게 출현하는지를 역전시킨다는 주장도 제기되었다.<ref>{{서적 인용|last=Tuomi|first=Ilkka|date=2000|title=Data is more than knowledge|journal=Journal of Management Information Systems|volume=6|issue=3|pages=103–117|doi=10.1080/07421222.1999.11518258}}</ref> 일반적으로 정보의 개념은 제약, 통신, 통제, 자료, 형식, 지시, 지식, 의미, 정신적 자극, [[패턴]], 지각 및 표현의 개념과 밀접하게 관련되어 있다.<!--given by nupur set--> 베이논-데이비스는 [[기호]]의 개념을 사용하여 자료와 정보를 구별한다. 자료는 일련의 기호이며, 정보는 기호가 어떤 것을 지칭하는 데 사용될 때 발생한다.<ref>{{서적 인용|author=P. Beynon-Davies|year=2002|title=Information Systems: An introduction to informatics in organisations|url=https://archive.org/details/informationsyste0000beyn|publisher=[[팰그레이브 맥밀런]] |location=Basingstoke, UK|isbn=0-333-96390-3}}</ref><ref>{{서적 인용|author=P. Beynon-Davies|year=2009|title=Business information systems|url=https://archive.org/details/businessinformat0000beyn|publisher=Palgrave |location=Basingstoke, UK|isbn=978-0-230-20368-6}}</ref> 컴퓨팅 장치와 기계가 개발되기 전에는 사람들이 자료를 수동으로 수집하고 패턴을 부여해야 했다. 컴퓨팅 장치와 기계가 개발되면서 이러한 장치도 자료를 수집할 수 있게 되었다. 2010년대에는 [[마케팅]], 시민의 [[사회 복지]] 사용 분석에서 과학 연구에 이르는 다양한 분야에서 자료를 수집하고 분류하거나 처리하기 위해 컴퓨터가 널리 사용되었다. 자료의 이러한 패턴은 지식을 향상시키는 데 사용될 수 있는 정보로 간주된다. 이러한 패턴은 "[[진리]]"로 해석될 수 있으며 (비록 "진리"는 주관적인 개념일 수 있지만) 일부 분야 또는 문화에서는 미학적 및 윤리적 기준으로 권한을 부여받을 수 있다. 지각할 수 있는 물리적 또는 가상적 흔적을 남기는 사건은 자료를 통해 추적될 수 있다. 흔적과 관측 사이의 연결이 끊어지면 흔적은 더 이상 자료로 간주되지 않는다.<ref>{{서적 인용|author=Sharon Daniel|title=The Database: An Aesthetics of Dignity}}</ref> 기계적 컴퓨팅 장치는 자료를 표현하는 방식에 따라 분류된다. [[아날로그 컴퓨터]]는 자료를 전압, 거리, 위치 또는 기타 물리량으로 나타낸다. [[컴퓨터|디지털 컴퓨터]]는 고정된 [[음소문자|알파벳]]에서 추출된 일련의 기호로 자료를 나타낸다. 가장 일반적인 디지털 컴퓨터는 이진 알파벳, 즉 일반적으로 "0"과 "1"로 표시되는 두 문자로 된 알파벳을 사용한다. 숫자나 문자처럼 더 친숙한 표현은 이진 알파벳에서 구성된다. 일부 특수한 형태의 자료는 구별된다. [[컴퓨터 프로그램]]은 지침으로 해석될 수 있는 자료의 모음이다. 대부분의 컴퓨터 언어는 프로그램과 프로그램이 작동하는 다른 자료를 구별하지만, 특히 [[리스프]]와 유사한 언어와 같은 일부 언어에서는 프로그램이 다른 자료와 본질적으로 구별되지 않는다. [[메타데이터]], 즉 다른 자료에 대한 설명을 구별하는 것도 유용하다. 메타데이터에 대한 유사하지만 더 이른 용어는 "보조 자료"이다. 메타데이터의 전형적인 예는 도서 내용에 대한 설명인 도서관 목록이다. == 자료 출처 == 마케팅 또는 기타 기업 수집 과정에서 수집된 자료의 소유권과 관련하여, 자료는 원본에 얼마나 가까운지 또는 추가 처리를 통해 생성되었는지에 따라 "당사자"에 따라 분류되었다. "제로 파티 데이터"는 고객이 "의도적으로 그리고 적극적으로 공유하는" 자료를 의미한다.<ref>{{웹 인용|last=Liu |first=Stephanie |date=2020-07-30 |title=Straight From The Source: Collecting Zero-Party Data From Customers |url=https://www.forrester.com/blogs/straight-from-the-source-collecting-zero-party-data-from-customers/ |access-date=2025-01-14 |website=Forrester |language=en-US}}</ref> 이러한 종류의 자료는 구독, 선호도 센터, 퀴즈, 설문조사, 팝업 양식 및 인터랙티브 디지털 경험을 포함한 다양한 출처에서 나올 수 있다.<ref>{{웹 인용|last=Greenstein |first=Danielle |date=2019-08-19 |title=What is First-Party vs Third-Party Data: Definitions & Strategies |url=https://www.lotame.com/1st-party-2nd-party-3rd-party-data-what-does-it-all-mean/ |access-date=2025-01-14 |website=Lotame |language=en-US}}</ref> "퍼스트 파티 데이터"는 기업이 고객으로부터 직접 수집할 수 있다.<ref>{{웹 인용|last=Studio |first=AdExchanger Content |date=2025-01-02 |title=The Dawn Of First-Party Data: Navigating The New Advertising Landscape |url=https://www.adexchanger.com/content-studio/the-dawn-of-first-party-data-navigating-the-new-advertising-landscape/ |access-date=2025-01-14 |website=AdExchanger |language=en-US}}</ref> 기업 간의 퍼스트 파티 데이터의 안전한 교환은 [[데이터 클린 룸]]을 사용하여 수행될 수 있다.<ref name=":1">{{웹 인용|last=Bridgwater |first=Adrian |title=Third-Party Data Is Now First-Class |url=https://www.forbes.com/sites/adrianbridgwater/2023/04/21/third-party-data-is-now-first-class/ |access-date=2025-01-14 |website=Forbes |language=en}}</ref> "세컨드 파티 데이터"는 다른 조직이나 파트너로부터 구매 또는 기타 수단을 통해 얻은 자료를 의미하며, "다른 조직의 퍼스트 파티 데이터"로 묘사되어 왔다.<ref name=":2">{{웹 인용|last=Fallows |first=Carley |date=2025-01-13 |title=Which Data Source Can You Trust for Better Marketing ROI? |url=https://www.littlegatepublishing.com/2025/01/which-data-source-can-you-trust-for-better-marketing-roi/ |url-status=live |archive-url=https://web.archive.org/web/20250305152314/https://www.littlegatepublishing.com/2025/01/which-data-source-can-you-trust-for-better-marketing-roi/ |archive-date=2025-03-05 |access-date=2025-01-14 |website=Littlegate Publishing |language=en-GB}}</ref><ref>{{웹 인용|last=Greenstein |first=Danielle |date=2024-03-15 |title=What is Second Party Data and How Can you Use it? |url=https://www.lotame.com/what-is-second-party-data/ |access-date=2025-01-14 |website=Lotame |language=en-US}}</ref> "서드 파티 데이터"는 다른 조직에 의해 수집되고 이후 다양한 출처, 웹사이트 및 플랫폼에서 집계된 자료이다.<ref name=":2" /> {| class="wikitable" |+자료 출처 요약<ref name=":2" /> !자료 출처 !소유자 !정확성 !사용 사례 !개인 정보 위험 |- |퍼스트 파티 |기업 |높음 |개인화, 리타겟팅 |낮음 |- |세컨드 파티 |파트너 |보통 |파트너십 캠페인 |보통 |- |서드 파티 |외부 주체 |낮음 |광범위한 타겟팅 |높음 |} "노 파티" 데이터는 때때로 원본 데이터의 패턴을 기반으로 생성된 합성 데이터를 의미할 수 있다.<ref name=":1" /> == 자료 문서 == 자료가 등록되어야 할 때마다 자료는 자료 [[문서]]의 형태로 존재한다. 자료 문서의 종류는 다음과 같다. * [[데이터 저장소]] *자료 연구 * [[자료 집합]] * [[소프트웨어]] *자료 논문 * [[데이터베이스]] *자료 핸드북 *자료 저널 이러한 자료 문서 중 일부(자료 저장소, 자료 연구, 자료 집합, 소프트웨어)는 [[자료 인용 색인]]에 색인되어 있는 반면, 자료 논문은 전통적인 서지 데이터베이스(예: [[과학 인용 색인]])에 색인되어 있다. ===자료 수집=== 자료 수집은 1차 출처(연구자가 자료를 처음으로 얻는 사람) 또는 2차 출처(연구자가 과학 저널에 배포된 자료와 같이 다른 출처에서 이미 수집된 자료를 얻는 사람)를 통해 이루어질 수 있다. 자료 분석 방법론은 다양하며 자료 삼각측량 및 자료 여과를 포함한다.<ref>Mesly, Olivier (2015), Creating Models in Psychological Research, Springer Psychology : 126 pages. {{ISBN|978-3-319-15752-8}}</ref> 후자는 연구의 객관성을 극대화하고 조사 중인 현상에 대한 가능한 한 완전한 이해를 허용하기 위해 다섯 가지 가능한 분석 각도(최소 세 가지)를 사용하여 자료를 수집, 분류 및 분석하는 명확한 방법을 제공한다. 이는 질적 및 양적 방법, 문헌 검토(학술 기사 포함), 전문가 인터뷰 및 컴퓨터 시뮬레이션을 포함한다. 이후 자료는 가장 관련성이 높은 정보를 추출하기 위해 일련의 사전 결정된 단계를 사용하여 "여과"된다. == 자료 수명 및 접근성 == [[컴퓨터 과학]], [[컴퓨터 데이터 스토리지|기술]] 및 [[문헌정보학]]에서 중요한 분야는 자료의 수명이다. [[연구|과학 연구]]는 특히 [[유전체학]] 및 [[천문학]]뿐만 아니라 [[의료 과학]], 예를 들어 [[의학촬영]]에서도 엄청난 양의 자료를 생성한다. 과거에는 과학 자료가 [[과학 문헌|논문]]과 책으로 출판되어 도서관에 저장되었지만, 최근에는 거의 모든 자료가 [[하드 드라이브]]나 [[광 디스크]]에 저장된다. 그러나 종이와 달리 이러한 저장 장치는 수십 년 후에 읽을 수 없게 될 수 있다. 과학 출판사 및 도서관은 수십 년 동안 이 문제로 고심해 왔으며, 수세기 또는 심지어 영원히 자료를 장기 보관하는 만족스러운 해결책은 아직 없다. '''자료 접근성'''. 또 다른 문제는 많은 과학 자료가 [[데이터베이스]]와 같은 자료 저장소에 출판되거나 예치되지 않는다는 것이다. 최근 설문 조사에서 2년에서 22년 전에 출판된 516개 연구에 자료를 요청했지만, 이들 연구 중 요청된 자료를 제공할 수 있거나 제공할 의향이 있는 연구는 5개 중 1개 미만이었다. 전반적으로 자료를 검색할 가능성은 출판 후 매년 17%씩 감소했다.<ref>{{서적 인용|last1=Vines |first1=Timothy H. |last2=Albert |first2=Arianne Y. K. |last3=Andrew |first3=Rose L. |last4=Débarre |first4=Florence |last5=Bock |first5=Dan G. |last6=Franklin |first6=Michelle T. |last7=Gilbert |first7=Kimberly J. |last8=Moore |first8=Jean-Sébastien |last9=Renaut |first9=Sébastien |last10=Rennison |first10=Diana J. |date=2014-01-06 |title=The availability of research data declines rapidly with article age |journal=Current Biology |volume=24 |issue=1 |pages=94–97 |doi=10.1016/j.cub.2013.11.014 |issn=1879-0445 |pmid=24361065|s2cid=7799662 |doi-access=free |arxiv=1312.5670 |bibcode=2014CBio...24...94V }}</ref> 마찬가지로, [[드라이어드 (저장소)|드라이어드]]의 100개 자료 집합에 대한 설문 조사에서는 절반 이상이 연구 결과를 재현하기 위한 세부 정보가 부족한 것으로 나타났다.<ref>{{서적 인용|last1=Roche |first1=Dominique G. |last2=Kruuk |first2=Loeske E. B. |last3=Lanfear |first3=Robert |last4=Binning |first4=Sandra A. |date=2015 |title=Public Data Archiving in Ecology and Evolution: How Well Are We Doing? |journal=PLOS Biology |volume=13 |issue=11 |pages=e1002295 |doi=10.1371/journal.pbio.1002295 |issn=1545-7885 |pmc=4640582 |pmid=26556502 |doi-access=free }}</ref> 이는 출판되지 않았거나 재현할 충분한 세부 정보가 없는 과학 자료에 대한 접근의 심각한 상황을 보여준다. 재현성 문제에 대한 해결책은 [[FAIR 자료]]를 요구하려는 시도이다. 즉, 찾을 수 있고(Findable), 접근할 수 있고(Accessible), 상호 운용할 수 있으며(Interoperable), 재사용할 수 있는(Reusable) 자료이다. 이러한 요구 사항을 충족하는 자료는 후속 연구에 사용될 수 있으며 따라서 과학 및 기술을 발전시킨다.<ref>{{서적 인용|last=Eisenstein |first=Michael |date=April 2022 |title=In pursuit of data immortality |journal=Nature |volume=604 |issue=7904 |pages=207–208 |doi=10.1038/d41586-022-00929-3 |issn=1476-4687 |pmid=35379989|bibcode=2022Natur.604..207E |s2cid=247954952 |doi-access=free }}</ref> == 다른 분야에서 == 자료는 다른 분야에서도 점점 더 많이 사용되고 있지만, 자료의 고도로 해석적인 성격이 "주어진 것"으로서의 자료의 정신과 상충될 수 있다는 의견도 있다. [[피터 체크랜드]]는 수많은 가능한 자료와 그 중 주의를 기울이는 하위 집합을 구별하기 위해 캡타(라틴어 capere, "취하다"에서 유래)라는 용어를 도입했다.<ref>{{서적 인용| author = P. Checkland and S. Holwell | title = Information, Systems, and Information Systems: Making Sense of the Field. | year = 1998 | publisher = John Wiley & Sons | location = Chichester, West Sussex | isbn = 0-471-95820-4 | pages = 86–89 }}</ref> [[요한나 드러커]]는 인문학이 지식 생산을 "상황에 따른, 부분적인, 구성적인" 것으로 단언하기 때문에 자료를 사용하는 것이 현상이 불연속적이거나 관찰자 독립적이라는 것과 같이 역효과를 낼 수 있는 가정을 도입할 수 있다고 주장했다.<ref>{{서적 인용|author=Johanna Drucker |year=2011 |title=Humanities Approaches to Graphical Display |journal=Digital Humanities Quarterly |volume=005 |issue=1 |url=https://digitalhumanities.org/dhq/vol/5/1/000091/000091.html }}</ref> 관찰 행위를 구성적인 것으로 강조하는 캡타라는 용어는 인문학의 시각적 표현을 위한 자료의 대안으로 제시된다. '''데이터 기반'''이라는 용어는 다른 모든 요소보다 자료에 의해 주로 강제되는 활동에 적용되는 신조어이다. 데이터 기반 응용 프로그램에는 [[데이터 기반 프로그래밍]] 및 [[데이터 기반 저널리즘]]이 포함된다. == 같이 보기 == * [[정보]] * [[자료형]] * [[데이터 처리]] * [[데이터 마이닝]] * [[데이터 웨어하우스]] == 각주 == {{각주}} == 외부 링크 == * {{위키공용분류-줄}} * {{언어링크|ko}} [http://cafe.daum.net/statsas 통계분석연구회] {{통계학}} {{전거 통제}} {{위키데이터 속성 추적}} [[분류:자료| ]] [[분류:정보]]
자료
문서로 돌아갑니다.
검색
검색
자료 문서 원본 보기
새 주제