strcasecmp in c mit utf-8

« Vorherige1Nächste »

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

microft

Anmeldungsdatum:
6. August 2009

Beiträge: 454

Wohnort: Norddeutschland

Zitieren

18. Juni 2010 17:57

Hallo

Helft mir bitte mal auf die Sprünge. strcasecmp kann ja wohl nur ascii. ich hab mal was über multibyte string lib in c gelesen, hab aber irgendwie die namen/bookmarks verbummelt.

danke

Lysander

Anmeldungsdatum:
30. Juli 2008

Beiträge: 2669

Wohnort: Hamburg

Zitieren

18. Juni 2010 19:38

Diese Funktion ist aber doch kein ANSI C, oder irre ich mich? Kommt mir jedenfalls nicht bekannt vor und in meinem O'Reilly kurz & gut steht die auch nicht drin. Woher stammt die denn bei Dir?

microft

(Themenstarter)

Anmeldungsdatum:
6. August 2009

Beiträge: 454

Wohnort: Norddeutschland

Zitieren

18. Juni 2010 20:01

Lysander schrieb:

Diese Funktion ist aber doch kein ANSI C, oder irre ich mich? Kommt mir jedenfalls nicht bekannt vor und in meinem O'Reilly kurz & gut steht die auch nicht drin. Woher stammt die denn bei Dir?

man strcasecmp

hieß früher mal stricmp

Ob das ansi is weiß ich nicht, ist aber seit 100 Jahren in der c lib.

Lysander

Anmeldungsdatum:
30. Juli 2008

Beiträge: 2669

Wohnort: Hamburg

Zitieren

18. Juni 2010 20:18

microft schrieb:

man strcasecmp

Dann kontere ich mal: man wcscasecmp

microft

(Themenstarter)

Anmeldungsdatum:
6. August 2009

Beiträge: 454

Wohnort: Norddeutschland

Zitieren

18. Juni 2010 20:33

Lysander schrieb:

microft schrieb:
man strcasecmp
Dann kontere ich mal: man wcscasecmp

Guter Konter;-)

Aber so richtig kompatibel ist er nicht. Erstmal meckert der Compiler wegen falsche Pointer und außerdem gehts so nicht. Ich hab hier offensichtlich das Problem wie die Parameter aussehen müßen, ordinäre strings sind es jedenfalls nicht.

Hab übrigens mittlerweiler ne toupper Funktion im Netz gefunden die funzt.

static char *stoupper(const char *s)
   {
   char *p = NULL, *oldp;
   size_t len;
   wchar_t wc;
   int wclen, mclen;

   if ( s ) 
      {
      len = strlen(s) ;
      oldp = p = malloc(len + MB_CUR_MAX + 1) ;
      if ( p ) 
         {
         while ((wclen = mbtowc(&wc, s, len)) > 0) 
            {
            /* I know, too many casts, but makes -Wconversion flag happy */
            mclen = wctomb(p, (wchar_t)towupper((wint_t)wc));
            /* Strange ... but I always trust Ben */
            if ( mclen > wclen ) 
               {
               len += (size_t)(mclen - wclen) ;
               mclen = (int)(p - oldp) ;
               /* realloc it's a pain, but what else can I do? */
               p = realloc(oldp,len) ;
               if ( !p ) { free(oldp) ; return NULL ; }
               oldp = p ;
               }
            p += mclen;
            s += wclen;
            }
         *p = '\0';
         p -= len;
         }
      }
   return p;
   }

Lunar

Anmeldungsdatum:
17. März 2006

Beiträge: 5792

Zitieren

20. Juni 2010 14:12 (zuletzt bearbeitet: 20. Juni 2010 14:13)

Zum Umgang mit UTF-8 in C ist es empfehlenswert, Drittbibliotheken wie z.B. ICU oder GLib zu verwenden. Insbesondere letztere Bibliothek ist bei der C Programmierung sowieso allgemein empfehlenswert und kann schon fast als "zweite Standardbibliothek" betrachtet werden.

Ganz allgemein ist der Verzicht auf C ebenfalls empfehlenswert.

« Vorherige1Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »