Spørgsmål:
Er der en måde at importere tabeller i PubMed Central til MySQL eller andre relationsdatabaser?
adjective_noun
2018-12-19 20:34:20 UTC
view on stackexchange narkive permalink

Jeg har brug for disse PMC-tabeller fra de medicinske tidsskrifter med det formål at integrere dataene med en beslutningstagningssoftware. Selvom jeg kan se, at man kan få adgang til fuldtekst til en artikel fra PMC her (som inkluderer artikeltabellen), men er der en måde at udtrække tabellen fra dette XML-dokument og eksportere til en lokal MySQL-database eller en hvilken som helst anden relationsdatabase?

Er det muligt at oprette forbindelse til en ekstern database? Hvilke data har du også brug for? Det hele? Kun papiret? Kun det abstrakte?
Jeg har kun brug for tabellerne fra de offentliggjorte artikler (hovedsageligt for at få adgang til individuelle patientkarakteristika som alder, køn, civilstand, sygdomshistorie osv.) Det er helt sikkert en mulighed at oprette forbindelse til en ekstern database.
En svar:
Alexandre georges
2019-02-03 13:55:13 UTC
view on stackexchange narkive permalink

Hvis du kan bruge R, skal du overveje at bruge webskrabning.

Se her: http://bradleyboehmke.github.io/2015/12/scraping-html-tables.html

Tabellerne er allerede til stede i de xml-filer, som PubMed tillader at downloade, men der er ingen måde at omstrukturere disse xml-komponenter i tabellerne. For eksempel er denne undersøgelse - (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5970438/), der udtrækker tabeller fra xml og omstrukturerer dem til MySQL-tabeller ved hjælp af algoritme til tekstminedrift.


Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 4.0-licens, den distribueres under.
Loading...