Keskustelut - Yleistä Höpinää - Henkilötietokannan luonti


Jari_Kettunen 21:07 31.8.12 
Onko joku perkannut suomalaisten etu- ja sukunimet jonkinlaiseen peräkkäistedostoon esim lähteestä: http://fi.wikipedia.org/wiki/Luettelo_etunimiluetteloista#Luettelot_suomenkielisess.C3.A4_kalenterissa_esiintyvist.C3.A4_nimist.C3.A4

Haluaisin tehdä pientä tallennus testiä ohjelmalle muutaman sadan tuhannen nimen kannalla, johon ajattelin josko lähteenä olisi etunimi ja sukunimi tiedostot joista sitten randomilla yhdistäisi nimet. Toimisi samalla demokantana.
Torak 19:24 2.9.12 
eis 11:23 3.9.12 
mistä sie ne sukunimet meinasit ottaa?
editoitu: 15:27 3.9.12
Jari_Kettunen 15:25 3.9.12 
eis kirjoitti:
mistä sie ne sukunimet meinasit ottaa?

Suomalaiset sukunimet löytyi wikistä pari tuntia meni kaiken kaikkiaan kun tein etunimistä (noin 400+400) ja sukunimistä (reilut 2000) sekä postinumeroista tiedostot. copy pastella ja notepadilla.

Vielä kun saisi yleisimmät katujen nimet. Koetin etsiskellä eri kaupuinkin katuluetteloita mutta huonolla menestyksellä. Postin osoitepalvelusta copypaste on vähän hidas. mutta pari sataa katuosoitetta riittäisi varmaan demomateriaalin käyttöön.

Jos joku tarvitsee voin laittaa jakoon. Ensimmäinen testi jo paljasti koodista puutteita kun kymmenkunta ohjelmaa ajoi uusia asiakkaita kantaan samanaikaisesti.
editoitu: 16:21 3.9.12
Grez 16:20 3.9.12 
Miksi muuten siinä testissä tarvitaan oikeita nimiä.. Eikö Amcaoe Moepaeia toimisi ihan yhtä hyvin kuin Matti Möttönen

Yleisimmät kadunnimet ~ yleisyysjärjestyksessä:
http://mureakuha.com/paste/?136c45728d8c03011bac72e68821b779

Eli kadut jotka esiintyy postinumeroluettelossa vähintään 50 kertaa. Sama katu voi esiintyä useamman kerran, jos se on jaettu useaan osaan (eri postitoimipaikkoihin). Tuossa on nyt kuitenkin 481 kpl. (Tuli näköjään otsikkorivi ekaksi, eli "Nimi" ei ole katu ;D )
Jari_Kettunen 17:17 3.9.12 
Grez kirjoitti:
Miksi muuten siinä testissä tarvitaan oikeita nimiä.. Eikö Amcaoe Moepaeia toimisi ihan yhtä hyvin kuin Matti Möttönen


Kiitos osoitteista. Oikeat nimet on sen takia mukavampia kannassa kun demoaa niin silloin hautkin näyttävät paremmilta. On möttöset jonossa kun tekee nimellä hakua. Ja etunimellä nimellä voi vielä laittaa sukupuoli bitit kohdalleen.
Pitänee vielä jostain etsiskellä ammattiluokituksia niin menee täydestä kuin väärä raha.

Grez 17:28 3.9.12 
Jaa niin, en näköjään lukenut tuota viimeistä lausetta "Toimisi samalla demokantana" ja ajattelin vain testaamista varten.
Torak 18:40 3.9.12 
Jari_Kettunen kirjoitti:
Suomalaiset sukunimet löytyi wikistä pari tuntia meni kaiken kaikkiaan kun tein etunimistä (noin 400+400) ja sukunimistä (reilut 2000) sekä postinumeroista tiedostot. copy pastella ja notepadilla.


Etunimet + sukunimet copy paste wikistä meni ehkä viisi minuuttia.
(semmoinen hieno toiminto kun tyhien merkkien automaattinen poisto).
eis 14:27 6.9.12 
Grez kirjoitti:
Miksi muuten siinä testissä tarvitaan oikeita nimiä.. Eikö Amcaoe Moepaeia toimisi ihan yhtä hyvin kuin Matti Möttönen


Oma mielipide on, että kyllä ne parantavat testauksenkin laatua - todellisuus tapaa olla moninaisempi kuin mitä generoidessa kuvittelisi.
editoitu: 17:22 6.9.12
Grez 17:21 6.9.12 
Siis tarkoititko että generoidut parantavat testauksen laatua, kun saadaan mukaan muitakin merkkejä kuin mitä nimissä esiintyy? Saattaahan joku vahingossa tunkasta vaikka mitä merkkejä ohjelmaa oikeasti käyttäessä.
editoitu: 23:31 6.9.12
Jari_Kettunen 23:30 6.9.12 
Grez kirjoitti:
Siis tarkoititko että generoidut parantavat testauksen laatua, kun saadaan mukaan muitakin merkkejä kuin mitä nimissä esiintyy? Saattaahan joku vahingossa tunkasta vaikka mitä merkkejä ohjelmaa oikeasti käyttäessä.


En nyt ymmärrä mitä ajat takaa mutta yks lysti mitä joku kenttiin syöttää. ns vaarallinen syöte on estetty muuten, joten sitä ei tarvitse testata. Nyt alkaa olla muutaman sadantuhannen asiakkaan kanta sivutuotteena. Testaan socketserverin ja clientin kuormansietoa ja erilaisilla lisäys muutos ajoilla ja samalla syntyy kantaa. Kyseessä on c# windows client ja data haetaan c# tcpsocket serveriltä.
Grez 00:10 7.9.12 
Jari_Kettunen kirjoitti:
En nyt ymmärrä mitä ajat takaa
Kommentoin eis:n viestiin.
eis 11:19 7.9.12 
Grez kirjoitti:
Siis tarkoititko että generoidut parantavat testauksen laatua, kun saadaan mukaan muitakin merkkejä kuin mitä nimissä esiintyy? Saattaahan joku vahingossa tunkasta vaikka mitä merkkejä ohjelmaa oikeasti käyttäessä.


En. Tarkoitin, että oikeankaltaisissa nimissä voi hyvinkin esiintyä keissejä jotka eivät generoitaessa tule mieleen. Ei sellaisen datan käyttämisellä ole tarkoitus korvata sitä että joka tapauksessa testataan kaikenlaisia erikoismerkkejä sun muuta inputtia, eikä se tarkoita etteikö generointiakin voisi hyödyntää.
Grez 13:52 7.9.12 
Niin, toki molempi parempi. Tosin erikoisimpia keissejä tuskin edes tulee vastaan jos otetaan yleisimmät etu- ja sukunimet.