Classifiers of Data Sharing Statements in Clinical Trial Records.

Clinical Trials as Topic Information Dissemination Humans Natural Language Processing Electronic Health Records / classification

BERT in Healthcare Text Analysis Clinical Trial Data Classification IPD Sharing Statement Evaluation NLP Applications in Medicine

Journal

Studies in health technology and informatics

ISSN: 1879-8365

Titre abrégé: Stud Health Technol Inform

Pays: Netherlands

ID NLM: 9214582

Informations de publication

Date de publication:
22 Aug 2024

Historique:

medline: 23 8 2024

pubmed: 23 8 2024

entrez: 23 8 2024

Statut: ppublish

Résumé

Digital individual participant data (IPD) from clinical trials are increasingly distributed for potential scientific reuse. The identification of available IPD, however, requires interpretations of textual data-sharing statements (DSS) in large databases. Recent advancements in computational linguistics include pre-trained language models that promise to simplify the implementation of effective classifiers based on textual inputs. In a subset of 5,000 textual DSS from ClinicalTrials.gov, we evaluate how well classifiers based on domain-specific pre-trained language models reproduce original availability categories as well as manually annotated labels. Typical metrics indicate that classifiers that predicted manual annotations outperformed those that learned to output the original availability categories. This suggests that the textual DSS descriptions contain applicable information that the availability categories do not, and that such classifiers could thus aid the automatic identification of available IPD in large trial databases.

Identifiants

DOI: 10.3233/SHTI240541 PMID: 39176922

pubmed: 39176922

pii: SHTI240541

doi: 10.3233/SHTI240541

doi:

Types de publication

Journal Article

Langues

eng

Sous-ensembles de citation

Pagination

834-838

Classifiers of Data Sharing Statements in Clinical Trial Records.

Journal

Informations de publication

Résumé

Identifiants

Types de publication

Langues

Sous-ensembles de citation

Pagination

Auteurs

Saber Jelodari Mamaghani (S)

Cosima Strantz (C)

Dennis Toddenroth (D)

Articles similaires

[Redispensing of expensive oral anticancer medicines: a practical application].

Smoking Cessation and Incident Cardiovascular Disease.

Evaluation of Low-Value Services Across Major Medicare Advantage Insurers and Traditional Medicare.

Effectiveness of Virtual Yoga for Chronic Low Back Pain: A Randomized Clinical Trial.

Classifications MeSH