Σχόλια

  • από stassa πριν 3022 μέρες       

    Είναι λίγο biased, πχ που λέει τους δύο από την άλλη αίθουσα "pair of cheaters", ενώ απλά φέρονταν "περίεργα" και τα γραπτά τους δεν μοιάζανε.

    Επίσης το οτι είναι "σχεδόν αδύνατο" να συμβαίνει κάτι δεν σημαίνει οτι δεν συνέβη. Δεν μ' αρέσει πολύ η απόλυτη βεβαιότητα οτι ο τάδε μαθητής αντιγράφει επειδή "το ξέρω οτι αντιγράφει" και υπάρχει και μεγάλη πιθανότητα όντως ν' αντιγράφει. Τί γίνεται αν το γράφημα δείχνει μεγάλη πιθανότητα ν' αντιγράφει ο αγαπημένος μαθητής του καθηγητή; Εκεί να δεις εναλλακτικές εξηγήσεις;

    Btw, πλάκα έχει η R. Λίγο σαν το μπάσταρδο της javascript και της FORTRAN :)

    • από th.alys πριν 3022 μέρες       

      Δεν ξέρεις με σιγουριά, αλλά είναι σα να βρει το τεστ κατάλοιπα πυρίτιδας στα χέρια του τύπου που συνελήφθη πάνω από το πτώμα και δίπλα του βρισκόταν το όπλο του φονικού. Δεν βλέπω πώς εμπίπτει στο reasonable doubt.

      Υποπτεύομαι ότι κάθε διορθωτής έχει παρόμοιες υποψίες, αλλά ελάχιστοι μπαίνουν στην διαδικασία να κυνηγήσουν τους κλέφτες. Βοηθάει εν προκειμένω το ότι ήταν πολλαπλής επιλογής το τεστ και τ'ότι ο καθηγητής είχε όρεξη να τους τιμωρήσει.

    • από stassa πριν 3021 μέρες       

      Ε, γενικά έχω λίγο πρόβλημα με τα "standards of proof" σε δικαστήρια αλλά και αλλού. Απ' τη στιγμή που έχουμε αποφασίσει οτι μόνο η Επιστημονική Μέθοδος™ μας δίνει μια ελπίδα να γνωρίσουμε την αλήθεια, από πού κι ως πού δεχόμαστε να καταδικάζουμε ανθρώπους σε στέρηση των δικαιωμάτων τους με βάση πολύ χαλαρότερα κριτήρια;

      Ας πούμε, οι αποφάσεις σε δίκες συνήθως λαμβάνονται με βάση τί κάπνισε στους ένορκους, τις προκαταλήψεις του δικαστή, πόσα χρήματα είχε στη διάθεσή του ο υπόδικος για να πληρώσει το δικηγόρο του κλπ κλπ, οτιδήποτε παράγοντες θες που δεν έχουνε να κάνουνε τίποτα με τα γεγονότα των πράξεων για τις οποίες κατηγορείται.

      Αν έχεις βρεθεί υπόδικος ποτέ (εύχομαι να μην έχεις) ίσως ξέρεις το συναίσθημα που σε πιάνει, οτι "μανούλα μου! Και τώρα, τί τους εμποδίζει να με βρούνε ένοχο ενώ δεν έχω καμμία σχέση;". Και η απάντηση βέβαια είναι: "τίποτα". Εδώ κάνουμε λάθη και με εργαλεία όπως η λογική, τα υπόλοιπα μαθηματικά, οι υπολογιστές κλπ κλπ. Όχι και χωρίς τέτοια εργαλεία στη διάθεσή μας (όπως οι δικαστές ή οι ένορκοι).

      Αυτά. Βαρετή μέρα στη δουλειά σήμερα. Ξέρει κανείς από semi-supervised learning? :P

    • από th.alys πριν 3021 μέρες       

      Δεν γίνεται να μην λαμβάνουμε ποτέ καμμία απόφαση όσο υπάρχει έστω κι ελάχιστη πιθανότητα αμφιβολίας. Εν προκειμένω δε δεν μιλάμε για φυλάκιση ή κάτι τόσο βαρύ. Ένα μάθημα έπρεπε να ξαναδώσουν.

    • από stassa πριν 3021 μέρες       

      «Δεν γίνεται να μην λαμβάνουμε ποτέ καμμία απόφαση όσο υπάρχει έστω κι ελάχιστη πιθανότητα αμφιβολίας.»

      Ε πώς, όχι. Αν μου ζητήσεις να πάρω μια απόφαση που έχει έστω και την ελάχιστη πιθανότητα να μου στοιχίσει τη ζωή ή την ελευθερία, θα το βρεις εξαιρετικά δύσκολο να με πείσεις ... όταν πρόκειται για την ζωή ή την ελευθερία ενός τρίτου όμως δεν φαίνεται να δυσκολευόμαστε τόσο πολύ. Γι' αυτό ακριβώς χρειάζεται ένα εξεραιτικά αυστηρό κριτήριο για το τί δεχόμαστε ως "αλήθεια" και "γεγονός".

      «Εν προκειμένω δε δεν μιλάμε για φυλάκιση ή κάτι τόσο βαρύ. Ένα μάθημα έπρεπε να ξαναδώσουν.»

      Τέλος πάντων. Δεκτόν.

    • από th.alys πριν 3021 μέρες       

      "Αν μου ζητήσεις να πάρω μια απόφαση που έχει έστω και την ελάχιστη πιθανότητα να μου στοιχίσει τη ζωή ή την ελευθερία, θα το βρεις εξαιρετικά δύσκολο να με πείσεις"

      Does not compute! Υπάρχει μη μηδενική πιθανότητα να σου πέσει ο ουρανός στο κεφάλι. Κάτι μου λέει ότι περπατάς στον δρόμο κάθε μέρα.

  • από stassa πριν 3021 μέρες       

    Λάθος θέση :)

  • από Epanechnikov πριν 3020 μέρες 1       

    Όλα τα κριτήρια αποφάσεων που χρησιμοποιούμε (όχι μόνο στην επιστήμη αλλά και στη καθημερινή μας ζωή) έχουν false positive και false negative rates. Και επειδή αλάνθαστα κριτήρια δεν υπάρχουν και το εναλλακτικό της χρήσης αυτών είναι η πλήρης αδράνεια δύο πράγματα μας μένουν να κάνουμε. Πρώτον να αναζητούμε συνεχώς τα κριτήρια εκείνα που έχουν τα μικρότερο ποσοστά σφάλματος και δεύτερον να λαμβάνουμε αποφάσεις έχοντας ζυγίσει τα συνεπακόλουθα των αποφάσεων με τις συσχετιζόμενες συνέπειες (οφέλη / κινδύνους) αυτών.

  • από stassa πριν 3020 μέρες       

    th.alys, κάτσε γιατί αν δεν βγω να περπατήσω θα ψοφήσω της πείνας. Εξ' άλλου την ιδέα οτι μπορεί να μου πέσει ο ουρανός στο κεφάλι, ή πχ την ιδέα οτι κάθε μέρα παίρνω μια δόση ακτινοβολίας που σε χίλια χρόνια θα με σκοτώσει κλπ, σ' αυτές τις ιδέες λέω έχω συνηθίσει. Μιλάω για αποφάσεις μάλλον εξαιρετικής σημασίας και γενικά εξαιρετικές.

    Και πιο συγκεκριμμένα μιλάω για αποφάσεις σε δίκες. Αν μου πεις οτι υπάρχει .00001 πιθανότητα να είμαι αθώα κι ας βρέθηκαν όλα μου τα σωματικά υγρά πάνω στο πτώμα, θα κινήσω γη και ουρανό για να βρω έναν τρόπο να το κάνω αυτό το .00001 να μοιάζει μα 100. Αλλά όταν κάποιανού αλλονού το κεφάλι είναι στον τορβά, το πολύ να δω μην γίνεται .5.

    Epan, μα ναι, δεν διαφωνώ. Αλλά στην πράξη κανείς δεν παίρνει αποφάσεις μ' αυτόν τον τρόπο, μεθοδικά, λογικά και εμπεριστατωμένα να πούμε. Στην πράξη παίρνουμε αποφάσεις με το συναίσθημα κυρίως, ιδίως όταν έχει να κάνει με συναισθηματικά φορτισμένες καταστάσεις όπως φόνοι, βιασμοί, βιαιοπραγίες κλπ κλπ.

    Ή, τί να σου πω, είμαι συναισθηματική εγώ και τα βλέπω έτσι.

  • από stassa πριν 3020 μέρες       

    Στο θέμα του μπάζου, ή εκεί γύρω πάντως, μαθαίνω R τις τελευταίες δυο βδομάδες για ένα assignment (machine learning- μη γελάς, th.alys) και είναι καταφανές οτι η γλώσσα έχει δημιουργηθεί από (και για) τρελλά ικανούς ανθρώπους που είναι απίστευτα άσχετοι με το software engineering.

    Πάρτε παράδειγμα, documentation για τη συνάρτηση data.frame, τη βασική data structure που γίνεται όλη η δουλειά σε R:

    «How the names of the data frame are created is complex, and the rest of this paragraph is only the basic story.»

    Ή αυτό ξέρω 'γω, από τη συνάρτηση svm:

    «kernel: the kernel used in training and predicting. You might consider changing some of the following parameters, depending on the kernel type.

    linear: u'*v
    polynomial: (gamma*u'*v + coef0)^degree
    radial basis: exp(-gamma*|u-v|^2)
    sigmoid: tanh(gamma*u'*v + coef0) »

    ΟΚ... αλλά οι τιμές που παίρνει η παράμετρος "kernel"... που είναι; Δεν τα λέει πουθενά. "radial basis" ας πούμε, είναι kernel type, ή είναι πώς το λέει ο τύπος που έκανε το documentation αυτό; Πρέπει να κάνεις πειράματα.

    Και γενικά το documentation είναι ένα χάλι μαύρο, άραχνο και κατακακομοιριασμένο.

    Αλλά έχει πλάκα :)

    Υ.Γ. Με ποιόν λέγαμε για τη fortran την άλλη φορά;

    • από th.alys πριν 3020 μέρες       

      Documentation και R δεν πάνε μαζί. Ψάξε για παραδείγματα κώδικα. Και κάτι μαθήματα σε coursera ή παρόμοια σάιτ.

    • από stassa πριν 3020 μέρες       

      Βρήκα, εντάξει, έχει μερικά καλά tutorials και τέτοια στα ίντερνετς, αλλά παναγιά μου. Δεν έχω συνηθίσει έτσι εγώ, έχω μάθει σε πρότζεκτς σαν το git και σε man pages μισό χιλιόμετρο.

    • από Epanechnikov πριν 3019 μέρες       

      Η svn είναι συνάρτηση του s1071 και για το κακό documentation δεν φταίει η R αλλά ο προγραμματιστής του πακέτου. H R βασίζεται στην γλώσσα S και πολύ documentation υπάρχει και εκεί (για data frames δες π.χ. John M. Chambers (1994) Variables in Data Frames. AT&T Bell Laboratories Statistics Research Report Number 94-2 - stat.bell-labs.com/doc/94.2.ps). Τα help files της R(στα οποία έχεις access χρησιμοποιώντας το ? πριν από το όνομα της συνάρτησης που θες να χρησιμοποιήσεις) σου δίνουν μια πολύ γρήγορη εξήγηση των λειτουργιών των συναρτήσεων και σου παρουσιάζουν τα arguments αυτών. Δεν έχουν σκοπό την πλήρη ανάλυση των λειτουργιών της γλώσσας. Ένα άλλο πράγμα που πρέπει να έχουμε υπόψιν είναι πως άλλο πράγμα η ίδια η γλώσσα S και άλλο οι βασικές συναρτήσεις της (όπως άλλο η C++ και άλλο η std). Παρεμπιπτόντως ένα πολύ καλό βιβλίο για αρχάριους στην R είναι το "The R Book" του Crawley.


      "Αλλά στην πράξη κανείς δεν παίρνει αποφάσεις μ' αυτόν τον τρόπο, μεθοδικά, λογικά και εμπεριστατωμένα να πούμε. Στην πράξη παίρνουμε αποφάσεις με το συναίσθημα κυρίως,..."

      Ναι ΟΚ αλλά αυτό δεν σημαίνει πως οι αποφάσεις που παίρνουμε με βάση το συναίσθημα δεν έχουν και αυτές τα δικά τους false positives/negatives. Καλό θα ήταν να έχουμε υπόψιν τα σφάλματα που κάνουμε σε κάθε περίπτωση για να μην μετακινούμε και τις δοκούς

    • από th.alys πριν 3019 μέρες       

      Έπαν η R έχει κακό documentation ακόμα και στο base package. Οφείλεται πιθανότατα στο ότι είναι open source project και οι πιο πολλές συναρτήσεις γράφονται από κόσμο που τις χρειάζεται για την δουλειά τους και μετά τις δίνει στην κοινότητα. Τα βιβλία είναι καλά για αρχάριους, αλλά από ένα σημείο και μετά google is your best friend. Ευτυχώς που έχει μεγάλη κοινότητα και συνήθως την απορία σου την είχε και την απάντησε κάποιος πριν από σένα.

    • από Epanechnikov πριν 3019 μέρες       

      Οι βασικές συναρτήσεις είναι κληρονομημένες από την S του Chambers που δεν είναι open source. Στις βασικές δεν νομίζω πως υπάρχει ουσιαστικό πρόβλημα. Ενδεχομένως το documentation να μην είναι όσο extensive όσο σε άλλες παρόμοιες γλώσσες (Python, Matlab). Στα πακέτα του CRAN τα πάντα εξαρτώνται από τους contributors. Συμφωνώ πως το google είναι πολύ χρήσιμο αλλά νομίζω πως για advanced (extensions κτλ) καλό είναι να έχεις περάσει και το S Programming (Venables, Ripley) ένα χέρι.

      Πολύ ωραία γλώσσα η R πάντως αν δουλεύεις με δεδομένα. Έχει τα προβληματάκια της (πολύ αργή σε loops, άλλα inconsistencies π.χ. γνωρίζεις πως το = είναι πολύ αργό σε σχέση με το ισοδύναμο του *δεν βάζω το σύμβολο γιατί θα χαθεί το επόμενο μέρος του μηνύματος μου*) αλλά χωρίς αυτή και τα πακέτα της μόνο με c++ δεν θα παλεύονταν τα tasks που γίνονται τώρα άνετα σε R.

    • από th.alys πριν 3019 μέρες 1       

      Α, ναι, για πες μου για λουπς. Έχω κάτι διπλά for που πρέπει να τρέξω και σκέφτομαι να κάνω φασίνα μέχρι να τελειώσουν. Ίσως προλάβω να πάω και στο σούπερ μάρκετ. :D

      Το -> το χρησιμοποιώ πάντα από συνήθεια. Έτσι έμαθα όταν ξεκίναγα, έτσι συνεχίζω κι ας έχω ξεχάσει πια τον λόγο. Για δεδομένα είναι η πιο intuitive γλώσσα. Αν ξεκίναγα τώρα όμως ίσως να προτιμούσα την python. C++ μακρυά από μας. Το ίδιο και το matlab.

  • από stassa πριν 3019 μέρες       

    «για data frames δεν π.χ. John M. Chambers (1994) Variables in Data Frames. AT&T Bell Laboratories Statistics Research Report Number 94-2 - stat.bell-labs.com/doc/94.2.ps).»

    Ενδιαφέρον, δεν είχα ιδέα. Δηλαδή ήξερα για την S και την σχέση της με την R, αλλά όχι πολλά. Νομίζω πάντως αυτές τις μέρες κάπου πήρε το μάτι μου το manual της libsvm και δεν ήτανε τόσο χάλια

    Χμ, τώρα πρόσεξα οτι το documentation της svm() στο e1071 έχει και λινκ στο libsvm. OK, θα μπορούσα να το έχω κοιτάξει καλύτερα. Ίσως απλά έχω κακομάθει και μου χρειάζεται μια επιστροφή στα 1960 για να συνέρθω ΧD


    « το = είναι πολύ αργό σε σχέση με το ισοδύναμο του [βελάκι ζερβά]»

    Δεν τό 'ξερα, θενκσ. Δεν έχω κοιτάξει πολύ στο πώς λειτουργεί η γλώσσα ακόμη. Κάτι πήρε το μάτι μου για vectorization και χάρηκα που δεν χρειάζεται να γράφεις for loops, μέχρι εκεί.


    th.alys, μπα, δεν νομίζω οτι είναι το open source του πράγματος, οι περισσότεροι οπενσορσάδες τρελλαίνονται να γράφουνε και να διαβάζουνε documentation. Κοίτα να δεις τίποτα vim, emacs, maven, git, man pages για όλα τα cli προγράμματα στο linux, όλα τα πάντα, σελίδες επί σελίδων. Μέχρι και το Powershell έχει δικό του σύστημα για documentation, που είναι της MS (κι είναι κι αστέρι).

    Εγώ έχω πειστεί οτι είναι επειδή η γλώσσα δεν απευθύνεται σε coders και software engineers. Ή πιθανόν όσοι ασχολούνται με τη στατιστική έχουνε συνηθίσει να κοπανάνε το κεφάλι τους στον τοίχο και δεν τους πονάει πια :P

    Ή ίσως είναι αυτό που έχουνε στις επιστήμες, που δεν θέλουνε να τα παραεξηγάνε μην τους περάσουνε για κουτούς, που δεν θεωρούνε πχ καλή γνώση της θεωρίας των υπερχορδών ως δεδομένη.

    th.alys, το apply δεν πάει πιο γρήγορα;

    • από stassa πριν 3019 μέρες       

      «C++ μακρυά από μας. Το ίδιο και το matlab»

      C++ έχει πλάκα, πονάει λίγο στην αρχή αλλά μετά σ' αρέσει. Όχι για γρήγορη επεξεργασία δεδομένων, εννοείτα- προς θεού.

      Το matlab εντάξει, ΟΚ, απλά κοστίζει πολύ κι έχει και 15 γίγα πακέτα ο διάολος.

    • από Epanechnikov πριν 3019 μέρες 1       

      "χάρηκα που δεν χρειάζεται να γράφεις for loops"

      Μπα ποιος σου είπε ότι δεν χρειάζεται. Χρειάζεται απλά τα αποφεύγεις σε R όσο γίνεται και κατά προτίμηση βουτάς τα χέρια και σε c++ (δες http://www.stat.berkeley.edu/scf/paciorek-cppWorkshop.pdf).

    • από th.alys πριν 3019 μέρες 1       

      "το apply δεν πάει πιο γρήγορα;"

      Έχω έτοιμο τον κώδικα από προηγούμενη δοκιμή. If it ain't broken...Άσε που ό,τι παρόμοιο κώδικα έχω βρει χρησιμοποιεί διπλό for. Ίσως να υπάρχει κάποια apply function που να κάνει την δουλειά, την αγνοώ και δεν υπάρχει λόγος να χάσω χρόνο ψάχνοντας. Για το συγκεκριμένο πρότζεκτ δεν είναι ιδιαίτερο πρόβλημα το for. Για άλλο βλέπουμε.

      Για το ότι δεν απευθύνεται σε soft.engineers και το documentation πιθανότατα έχεις δίκιο. Μερικά πράγματα ίσως παραλείπονται γιατί: "αν πας να τα τρέξεις αυτά, έχεις σίγουρα πάρει το ***101, άρα τι το θες το documentation;"

  • από stassa πριν 3019 μέρες       

    Α. Ε, καλά.

    Υ.Γ. Έχει ένα interface για R η swi prolog, θα γράφω τις λούπες μου εκεί (που δεν έχει for κι άλλα τέτοια procedural πράματα) :P

  • από stassa πριν 3019 μέρες       

    E λοιπόν όχι. Σε Ook! θα τα γράφω τα λουπς μου:

    http://en.wikipedia.org/wiki/Esoteric_programming_language#Ook.21


Log in για σχολιασμό ή γίνε μέλος εδώ.

Ποιά μέλη του buzz ψήφισαν αυτή την καταχώριση