
Začetniki se morajo lotiti znanstvenih pobud o evidenci podatkov, saj ponujajo hiter izlet in sodelujejo pri uporabi teoretičnih idej, pridobljenih v razredih, sestavljajo portfelj in izboljšujejo sposobnosti. To jim omogoča, da pridobijo samozavest in izstopajo na konkurenčnem trgu dela.
Moralo bi, da razmišljate o izzivu disertacije o znanosti o evidenci podatkov ali pa bi radi le pokazali veščino samodiscipline z Če izvajamo pošteno študijo in izdajamo razvite taktike napovedovanja podatkov o zapisih, bi lahko naslednje izzivne možnosti morda le bile kritične.
Napoved razpoloženja kritik izdelkaTo obsega preučevanje zgradbe podatkov o stanovanju in vizualizacije rasti za boljše uresničevanje možnosti. Za ponazoritev, koncept izziva bo pokukati v uporabniške kritike blaga na Amazonu z uporabo možnosti čiste jezikovne obdelave (NLP) o tem, kako pogledati ponavljajoče se razpoloženje do takih vprašanj. Da bi to dopolnili, je bila zbrana tudi gorata zbirka kritik izdelkov iz Amazona z uporabo metod spletnega strganja ali API-ja izdelkov Amazon.
Eden izmed mojih priljubljenih naborov podatkov na Kaggle:
Amazon Stories
Rešitve za vaš izziv:
• Izračunajte ponavljajočo se analitiko izdelka
• Porabite algoritme združevanja v skupine za blago posadke
• Nikoli -končanje primerov težav z NLP: napoved razpoloženja, ekstrakcija ključnih fraz, povzemanje
Prizadevajte si!
— David Miller (@thedavescience ) oktober , 418 Takoj ko bodo zbrane možnosti, bo celo predhodno obdelan z odstranitvijo besed, ločil in drugega hrupa. Polarnost pregleda ali ali je v njem prikazano razpoloženje precej dobro, škodljivo ali nevtralno, se lahko nato prepriča z izdajo algoritma za napoved razpoloženja vnaprej obdelanemu jeziku. Pri navajanju, da bi se oprijeli ponavljajočega se poznavanja izdelka, bi lahko posledice morda ustrezno predstavili z uporabo grafov ali drugih orodij za vizualizacijo podatkov o zapisih.
Predvidevanje cen stanovanj Ta izziv obsega izdelavo modela strojnega iskanja za napovedovanje cen stanovanj v koraku z različnimi komponentami, podobnimi regiji, kvadratnim fotografijam in zbirki spalnic.
Težava strojnega iskanja naš model, ki naredi izdajo podatkov o evidencah stanovanjskega trga, podobnih regiji, zbirki spalnic in kopalnic, kvadratnih fotografij in prejšnjih podatkov o prodaji, za oceno prodajne cene določene hiše je en primer izziva znanosti o evidencah podatkov, ki je povezan z napovedovanjem stanovanja cene.
Model bi morda lahko bil pravilno profesionalen na podlagi zapisov podatkov o zgradbi stanovanja preteklih prodaj stanovanj in preučen na ločenih zapisih podatkov o zgradbi stanovanja, da se upošteva njegova točnost. Zaključni cilj bi bil predstaviti zaznave in napovedi, ki bodo morda le spremljale nepremičninske posrednike, vlagatelje in prodajalce pri hitrih izbirah v zvezi s ceno in taktikami nabave/prodaje.
Segmentacija kupcev Izziv segmentacije kupca vključuje uporabo algoritmov za združevanje v skupine za usklajevanje strank v skladu z njihovim vedenjem pri nabavi, demografskimi podatki in drugimi komponentami.
Postopek podatkovne znanosti pri segmentaciji kupcev
Podatkovna znanost je revolucionirala samodisciplino segmentacije kupcev, tako da je podjetjem ponudila orodja za analizo ogromnih količin zapisov flota in natančno.
— Mastermindzero (@Mg_S_) 9. marec 2022 Znanstveni izziv o evidenci podatkov, povezan s segmentacijo kupcev, bi morda lahko vključeval preučevanje podatkov o evidenci kupca iz maloprodajnega podjetja, podobno zgodovini transakcij, demografiji in vedenjskim vzorcem. Cilj bi bil identificirati očitne segmente kupcev z uporabo taktike združevanja v skupine za združevanje strank z enakimi značilnostmi in identificirati komponente, ki razlikujejo vsako posadko.
Ta napoved bi morda lahko zagotovila vpogled v vedenje, preference in želje kupcev. , ki bi ga morda lahko pravilno razčlenili, da bi občudovali ciljno usmerjene tržne akcije, priporočila za izdelke in prilagojene izkušnje kupcev. Z naraščajočim ponosom kupcev, zvestobo in dobičkonosnostjo bi maloprodajno podjetje morda lahko izkoristilo posledice tega izziva.
Odkrivanje goljufijTa izziv vključuje konstruiranje model strojnega iskanja za odkrivanje lažnih transakcij v zgradbi podatkov o stanovanju. Problem strojnega odkrivanja algoritmov za pregledovanje podatkov o zapisih o finančnih transakcijah in vzorcev polja napačne dejavnosti je primer izziva znanosti o zapisih, povezanih z odkrivanjem goljufij.
Povezano: Kako dokončati spremljanje kriptovalut in napovedovanje verige blokov, ohraniti nekaj oddaljenost od goljufij s kriptovalutami?
Končni cilj je omogočiti zakonit model za odkrivanje goljufij, ki lahko pomaga finančnim institucijam pri boju z lažnimi transakcijami in varovanju računov njihovih pokroviteljev.
Razvrstitev slikeTa Izziv obsega izdelavo modela globokega odkrivanja za razvrščanje fotografij v izbrane kategorije. Znanstveni izziv pri razvrščanju slik in zapisov podatkov bi morda lahko vključeval izdelavo modela globokega odkrivanja za razvrščanje fotografij v izbrane kategorije v skladu z njihovimi vidnimi vidiki. Model bi morda lahko bil pravilno profesionalen na bistvenih zapisih o zgradbi stanovanja z označenimi fotografijami in nato preučen na ločeni evidenci podatkov o zgradbi stanovanja, da se upošteva njegova točnost.
Končni cilj bi bil pridobiti računalniški pripomoček za klasifikacijo slik, ki bi bil tudi razčlenjen na različne aplikacije, podobne prepoznavanju predmetov, kliničnemu slikanju in samovozečim vozilom.
Napoved časovnega zbiranja Ta izziv obsega preučevanje zapisov skozi čas in napovedovanje prihodnjih lastnosti. Izziv časovne napovedi zbiranja bi morda lahko vključeval preučevanje zgodovinskih podatkov o cenah za določeno kriptovaluto, podobno kot Bitcoin (BTC), z uporabo statističnih objektov in taktik strojnega iskanja za napovedovanje prihodnjih lastnosti cen.
Cilj bi bil predstaviti zaznave in napovedi, ki lahko pomagajo trgovcem in vlagateljem pri hitrem odločanju o koncu, prodaji in shranjevanju kriptovalut.
Pripomoček za predlogeTa izziv vključuje izdelavo pripomočka za priporočila, ki uporabnike opozarja na blago ali obvešča uporabnike v skladu z njihovim preteklim vedenjem in preferencami.
Metode sugestij so ena izmed najbolj široko razčlenjenih zadev strojnega odkrivanja.
Netflix, YouTube, Amazon: vsi izdajo pripomoček za priporočila v svojem jedru.
Tukaj je plemenit nabor podatkov, ki se ga je treba naučiti: https://t.co/j45uwjawL
26,000+ filmi. 26M ocen od več 45, uporabniki. pic.twitter.com/P3HhFKCixQ
— Abacus.AI (@abacusai) januar 21, 2022 A Izziv pripomočka za priporočila bi morda lahko vključeval preučevanje podatkov o uporabniških zapisih Netflixa, podobno kot zgodovina ogledov, ocene in iskalne poizvedbe, za izdajanje prilagojenih filmskih in televizijskih priporočil za razkritje. Cilj je pridobiti uporabnike z bolj prilagojenim in ustreznim potovanjem na platformo, kar bi morda lahko povečalo angažiranost in zadrževanje.
Net strganje in evidenca podatkovna prognoza Mrežno strganje je računalniško zbiranje podatkov o zapisih z več spletnih strani z uporabo modnega orodja BeautifulSoup ali Scrapy, medtem ko je napoved podatkov o zapisih tehnika preučevanja prejetih podatkov o zapisih z uporabo statističnih metod in algoritmov za strojno iskanje. Izziv bi morda lahko vključeval strganje evidencnih podatkov iz spletnega prostora in njihovo preučevanje z uporabo znanstvenih možnosti zapisnih podatkov o tem, kako zbrati vpoglede in napovedi vstopnic.
Povezano: 5 visoko plačanih karier v znanosti o zapisih
Poleg tega bo vključevalo zbiranje podatkov o vedenju kupcev, tržnih lastnostih ali drugih ustreznih temah z namenom, da bi organizacijam ali ljudem ponudili vpoglede in hitro pametna priporočila. Končni cilj je izdati ogromne količine podatkov o zapisih, ki bi lahko bili zlahka dostopni na spletu, da bi dobili vpogledna odkritja in reševanje s pomočjo podatkov o zapisih.
Napoved transakcije verige blokov Izziv napovedi transakcije blockchain obsega preučevanje podatkov o zapisih skupnosti blockchain, ki so podobni Bitcoinu ali Ethereumu, da se identificirajo vzorci, lastnosti in vpogledi v transakcije v skupnosti. To lahko pripomore k izbiri za razvijanje metod, ki v bistvu temeljijo na verigi blokov, in nedvomno razkrije naložbene izbire ali ustvarjanje kritja.
Bistveni cilj je, da vprašanje odprtosti in nespremenljivosti verige blokov povzroči občudovanje. sveže evidence podatkov o tem, kako se uporabniki skupnosti obnašajo, in da je bistvenega pomena, da si morda omislite, da bi občudovali decentralizirane aplikacije, ki bi lahko bile močnejše in odpornejše.
2022