Abap Forum on Gate²App

Posted: **Thu May 27, 2004 9:29 am**

Ich habe mal Olafs letztes Beispiel als Referenz verwendet (damit die Testläufe nicht ganz so lange dauern) und mit meiner für große Tabellen optimierten Variante verglichen.
Neben dem Vergleich der Summen habe ich noch die jeweils besten Zeiten verglichen,
damit einzelne Ausreißer (s. z.B. die maximale Laufzeit bei 10 Einträgen, verglichen mit der Minimalen für 100) nicht das Ergebnis verfälschen:

Jetzt noch mal überarbeitet - ADD bei Ladenhuetern (und die damit obsoleten WHEN-OTHERS- bzw. ELSE-Anweisungen) weggelassen, und 1 Million Einträge geprüft.

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

27.05.2004
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:          10  Maximale Materialnummer:             3
Dauerbrenner:                        0
Saisonartikel:                       0
Ladenhueter:                         3
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |         33  ms                        |         32  ms
Maximale Laufzeit:      |         76  ms                        |        172  ms
Mittelwert Laufzeit:    |         43  ms                        |         68  ms
Vergleichsroutine ist um Faktor                     1,03 langsamer als Referenzr
Vergleichsroutine ist um Faktor                     1,59 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:         100  Maximale Materialnummer:             7
Dauerbrenner:                        0
Saisonartikel:                       2
Ladenhueter:                         5
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |        136  ms                        |        132  ms
Maximale Laufzeit:      |        208  ms                        |        264  ms
Mittelwert Laufzeit:    |        151  ms                        |        160  ms
Vergleichsroutine ist um Faktor                     1,03 langsamer als Referenzr
Vergleichsroutine ist um Faktor                     1,06 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:       1.000  Maximale Materialnummer:            35
Dauerbrenner:                       10
Saisonartikel:                      22
Ladenhueter:                         3
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |      1.045  ms                        |      1.059  ms
Maximale Laufzeit:      |      1.105  ms                        |      1.442  ms
Mittelwert Laufzeit:    |      1.061  ms                        |      1.143  ms
Vergleichsroutine ist um Faktor                     1,01 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,08 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:      10.000  Maximale Materialnummer:           252
Dauerbrenner:                      161
Saisonartikel:                      90
Ladenhueter:                         1
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |     11.328  ms                        |     12.517  ms
Maximale Laufzeit:      |     15.673  ms                        |     13.763  ms
Mittelwert Laufzeit:    |     12.475  ms                        |     13.133  ms
Vergleichsroutine ist um Faktor                     1,10 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,05 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:     100.000  Maximale Materialnummer:         2.002
Dauerbrenner:                    1.646
Saisonartikel:                     355
Ladenhueter:                         1
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |    137.600  ms                        |    217.561  ms
Maximale Laufzeit:      |    146.181  ms                        |    268.567  ms
Mittelwert Laufzeit:    |    141.888  ms                        |    229.991  ms
Vergleichsroutine ist um Faktor                     1,58 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,62 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:   1.000.000  Maximale Materialnummer:        16.669
Dauerbrenner:                   15.319
Saisonartikel:                   1.348
Ladenhueter:                         2
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |  2.845.146  ms                        |  3.067.513  ms
Maximale Laufzeit:      |  2.898.925  ms                        |  3.122.678  ms
Mittelwert Laufzeit:    |  2.857.928  ms                        |  3.092.441  ms
Vergleichsroutine ist um Faktor                     1,08 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,08 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Gesamtlaufzeit in Mikrosekunden: 68.170.039
 

GeSHi ©

Wie man sieht, bricht der Vorsprung meiner Version, der bei 100.000 Einträgen doch recht deutlich ist, bei einer Million Einträgen ganz schön ein.
Ob das mit einer Häufung der beim COLLECT auftretenden Hash-Kollisionen zusammenhängt?
Oder vielleicht eher mit dem READ ... BINARY SEARCH, das zunehmend ineffizienter wird.
Da könnte man noch etwas ändern - wenn auch mit negativem Einfluss auf kleinere itabs.

Mein Code (nach Einbau eines kleinen Hinweises von Stefan):

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

FORM vergleich USING    t_input     TYPE tyt_input
                        p_max_matnr TYPE i
*                       Uebergabe per Referenz ist schneller,
*                       insbesondere das Kopieren der itab ist Aufwand
*
*                       und in dem Beispiel aendere ich die Parameter
*                       auch nicht, dem Aufrufer kann es also egal sein,
*                       dass ich die Werte nicht per VALUE uebergebe
               CHANGING p_ergebnis  TYPE ty_ergebnis.
*define _rt. " Test-Ausgabe Laufzeit von Einzelschritten
*  format color &1.
*  rt-from = rt-to.
*  get run time field rt-to.
*  rt-step = '&1'.
*  rt-diff = rt-to - rt-from.
*  write: / rt-tfill, rt-max, rt-step, rt-diff.
*end-of-definition.
*
*  statics: begin of rt, max type i, tfill type i, step, from type i, to type i, diff type i, end of rt.
  TYPES ty_char_mat&#40;4&#41; TYPE x.
  DATA: tmp_mat TYPE i VALUE 1. " ty_char_mat VALUE 1.
 
  DATA: last_tabix TYPE sy-tabix VALUE 1,
        tabix_diff TYPE i,
        my_input TYPE ty_input.
  TYPES: BEGIN OF ty_input2,
           material  TYPE ty_char_mat,
*        vom BUDAT des Originaltyps interessiert mich nur der Monat
           m&#40;2&#41;     TYPE c,
         END OF ty_input2.
 
  DATA: tmp_wa TYPE ty_input2,
        tmp_input TYPE STANDARD TABLE OF ty_input2
                   WITH NON-UNIQUE KEY material m.
 
  CLEAR p_ergebnis.
  CHECK NOT t_input IS INITIAL.
 
* Da SORT in meinem ersten Beispiel am meisten Laufzeit verbrauchte,
* jetzt ein Beispiel, das SORT nur auf eine kleinere Tabelle anwendet
* COLLECT erfordert hier eine Typ-Konvertierung von MATERIAL
*
* Wenn es mehr als 2^22 Kombinationen Material und Monat gibt,
* gibt es beim COLLECT allerdings einen Laufzeitfehler.
* Gibt es mehr als 4 Millionen verschiedene Kombinationen?
  LOOP AT t_input INTO my_input.
    tmp_wa-material = my_input-material.
    tmp_wa-m = my_input-budat+4&#40;2&#41;.
    COLLECT tmp_wa INTO tmp_input.
  ENDLOOP.
*  _rt 1.
* Statt SORT Ein weiteres COLLECT in eine neue itab lohnt erst ab
* 10^6 Eintraegen &#40;bzw. mehr als 2002 verschiedenen Materialien&#41;
 
  SORT tmp_input BY material.
*  _rt 2.
 
  DO p_max_matnr TIMES.
*   Suche den ersten Index fuer das naechstfolgende Material
    ADD 1 TO tmp_mat.
    READ TABLE tmp_input " INTO tmp_wa
         WITH KEY material = tmp_mat
         BINARY SEARCH TRANSPORTING NO FIELDS.
    CASE sy-subrc.
      WHEN 0.
*       Ermitteln der Anzahl Monate und passenden Zaehler erhoehen
        tabix_diff = sy-tabix - last_tabix.
*       je mehr Eintraege die itab hat, desto wahrscheinlicher sind
*       12 Monate pro Material vorhanden, zumindest im derzeitigen
*       Testszenario &#40;Anzahl verschiedener Materialien / Anzahl Eintraege
*
*       Wenn ich die wahrscheinliche Haeufigkeit der Faelle kenne,
*       kann ich das auch in der Reihenfolge der WHEN-Anweisungen beruecksichtigen
        CASE tabix_diff.
          WHEN 12.
*            ein ADD wegzulassen, war der Tipp von Stefan.
*            Er wollte aber die Anzahl Ladenhueter am Ende berechnen,
*            ich wollte diesen wahrscheinlichsten Fall weglassen und
*            so hoffentlich mehr sparen - hat aber nicht geklappt.
 
             ADD 1 TO p_ergebnis-dauerbrenner.
          WHEN 11 OR 10.
            ADD 1 TO p_ergebnis-saison.
*          WHEN OTHERS.
*            ADD 1 TO p_ergebnis-ladenhueter.
        ENDCASE.
*      WHEN 4.
**       Materialnummern, die gar nicht vorkommen, werden auch in der Referenzloesung gezaehlt:
*
**       &#40;Da verhaelt Olafs Loesung sich noch anders als die Referenz-Routine.
**       Eine kleine Aenderung korrigiert das - und spart evtl. noch ein wenig Laufzeit.&#41;
 *       ADD 1 TO p_ergebnis-ladenhueter.
      WHEN 8.
*       kein naechstes Material mehr, letzten Eintrag lesen
        READ TABLE tmp_input INTO tmp_wa
             INDEX sy-tfill TRANSPORTING material.
        CASE tmp_wa-material.
          WHEN p_max_matnr.
            tabix_diff = sy-tfill - last_tabix + 1.
            CASE tabix_diff.
              WHEN 12.
                ADD 1 TO p_ergebnis-dauerbrenner.
              WHEN 11 OR 10.
                ADD 1 TO p_ergebnis-saison.
*              WHEN OTHERS.
*                ADD 1 TO p_ergebnis-ladenhueter.
            ENDCASE.
*          WHEN OTHERS.
**           dieses Material und alle weiteren Materialien sind Ladenhueter
*           p_ergebnis-ladenhueter = p_ergebnis-ladenhueter - tmp_wa-material + p_max_matnr.
        ENDCASE.
        EXIT.
    ENDCASE.
*   zuletzt gelesenen Eintrag fuer naechsten Schleifendurchlauf merken
    last_tabix = sy-tabix.
  ENDDO.
*  p_ergebnis-dauerbrenner = p_max_matnr - p_ergebnis-ladenhueter - p_ergebnis-saison.
  p_ergebnis-ladenhueter = p_max_matnr - p_ergebnis-dauerbrenner - p_ergebnis-saison.
*  _rt 3.
*  format color off.
ENDFORM.                    " vergleich

GeSHi ©

Posted: **Thu May 27, 2004 9:48 am**

Und hier noch der Vergleich meiner ersten Lösung (nach Einbau von Stefans Tipp in meine Lösung und in Olafs Lösung):

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

27.05.2004
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:          10  Maximale Materialnummer:             3
Dauerbrenner:                        0
Saisonartikel:                       0
Ladenhueter:                         3
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |         27  ms                        |         32  ms
Maximale Laufzeit:      |         64  ms                        |        195  ms
Mittelwert Laufzeit:    |         35  ms                        |         66  ms
Vergleichsroutine ist um Faktor                     1,19 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,86 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:         100  Maximale Materialnummer:             7
Dauerbrenner:                        0
Saisonartikel:                       2
Ladenhueter:                         5
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |         94  ms                        |        136  ms
Maximale Laufzeit:      |        126  ms                        |        267  ms
Mittelwert Laufzeit:    |        101  ms                        |        163  ms
Vergleichsroutine ist um Faktor                     1,45 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,61 schneller &#40;Summe&#41;
 
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:       1.000  Maximale Materialnummer:            35
Dauerbrenner:                       10
Saisonartikel:                      22
Ladenhueter:                         3
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |        853  ms                        |      1.075  ms
Maximale Laufzeit:      |        890  ms                        |      1.304  ms
Mittelwert Laufzeit:    |        864  ms                        |      1.167  ms
Vergleichsroutine ist um Faktor                     1,26 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,35 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:      10.000  Maximale Materialnummer:           252
Dauerbrenner:                      161
Saisonartikel:                      90
Ladenhueter:                         1
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |     10.825  ms                        |     12.545  ms
Maximale Laufzeit:      |     12.363  ms                        |     18.124  ms
Mittelwert Laufzeit:    |     11.528  ms                        |     14.022  ms
Vergleichsroutine ist um Faktor                     1,16 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,22 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Anz. Eintraege in Tabelle:     100.000  Maximale Materialnummer:         2.002
Dauerbrenner:                    1.646
Saisonartikel:                     355
Ladenhueter:                         1
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |    197.305  ms                        |    224.252  ms
Maximale Laufzeit:      |    203.405  ms                        |    229.539  ms
Mittelwert Laufzeit:    |    199.877  ms                        |    227.151  ms
Vergleichsroutine ist um Faktor                     1,14 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,14 schneller &#40;Summe&#41;
--------------------------------------------------------------------------------
Gesamtlaufzeit in Mikrosekunden:  6.036.417

GeSHi ©

Hm - aus irgendeinem Grund ist Olafs Lösung durch meine Änderung etwas langsamer geworden. Aber weiter oben stehen ja die Werte für seine Originalversion.

Bei der Geschwindigkeit kann man dann auch mal eine Million Einträge prüfen (hier aber nur mit 3 Wiederholungen):

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

Anz. Eintraege in Tabelle:   1.000.000  Maximale Materialnummer:        16.669
Dauerbrenner:                   15.319
Saisonartikel:                   1.348
Ladenhueter:                         2
                        | Vergleich                             | Referenz
Minimale Laufzeit:      |  2.842.756  ms                        |  3.053.653  ms
Maximale Laufzeit:      |  2.848.541  ms                        |  3.177.316  ms
Mittelwert Laufzeit:    |  2.846.117  ms                        |  3.121.882  ms
Vergleichsroutine ist um Faktor                     1,07 schneller als Referenzr
Vergleichsroutine ist um Faktor                     1,10 schneller &#40;Summe&#41;

GeSHi ©

Olafs Lösung kommt meiner immer näher.

Noch eine Anmerkung:
Obwohl (für große Tabellen) viel weniger ADD-Anweisungen weggelassen werden,
ist die Variante, die Ladenhueter am Ende zu berechnen, ein wenig schneller.
(Ich spare mir aber, jetzt den geänderten Quelltext zu posten - das sollte jeder selbst hinkriegen.)

Und mein Quelltext

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

FORM vergleich USING    t_input     TYPE tyt_input
                        p_max_matnr TYPE i
*                       Uebergabe per Referenz ist schneller,
*                       insbesondere das Kopieren der itab ist Aufwand
*
*                       und in dem Beispiel aendere ich die Parameter
*                       auch nicht, dem Aufrufer kann es also egal sein,
*                       dass ich die Werte nicht per VALUE uebergebe
               CHANGING p_ergebnis  TYPE ty_ergebnis.
*define _rt. " Test-Ausgabe Laufzeit von Einzelschritten
*  format color &1.
*  rt-from = rt-to.
*  get run time field rt-to.
*  rt-step = '&1'.
*  rt-diff = rt-to - rt-from.
*  write: / rt-tfill, rt-max, rt-step, rt-diff.
*end-of-definition.
*
*  statics: begin of rt, max type i, tfill type i, step, from type i, to type i, diff type i, end of rt.
*  TYPES ty_char_mat&#40;4&#41; TYPE x.
 
  DATA: tmp_mat TYPE i VALUE 1. " ty_char_mat VALUE 1.
  DATA: last_tabix TYPE sy-tabix VALUE 1,
        tabix_diff TYPE i,
        my_input TYPE ty_input.
  TYPES: BEGIN OF ty_input2,
           material  TYPE i,
*        vom BUDAT des Originaltyps interessiert mich nur der Monat
           y&#40;4&#41;     TYPE c,
           m&#40;2&#41;     TYPE c,
           d&#40;2&#41;     TYPE c, " d kann ich auch weglassen
         END OF ty_input2.
 
  DATA: tmp_wa TYPE ty_input2,
        tmp_input TYPE STANDARD TABLE OF ty_input2
                   WITH NON-UNIQUE KEY material m.
 
  CLEAR p_ergebnis.
  CHECK NOT t_input IS INITIAL.
  tmp_input = t_input.
*  _rt 1.
  SORT tmp_input BY material m.
*  _rt 2.
  DELETE ADJACENT DUPLICATES FROM tmp_input COMPARING material m.
*  _rt 3.
  DO p_max_matnr TIMES.
*   Suche den ersten Index fuer das naechstfolgende Material
    ADD 1 TO tmp_mat.
    READ TABLE tmp_input " INTO tmp_wa
         WITH KEY material = tmp_mat
         BINARY SEARCH TRANSPORTING NO FIELDS.
    CASE sy-subrc.
      WHEN 0.
*       Ermitteln der Anzahl Monate und passenden Zaehler erhoehen
        tabix_diff = sy-tabix - last_tabix.
*       je mehr Eintraege die itab hat, desto wahrscheinlicher sind
*       12 Monate pro Material vorhanden, zumindest im derzeitigen
*       Testszenario &#40;Anzahl verschiedener Materialien / Anzahl Eintraege
*
*       Wenn ich die wahrscheinliche Haeufigkeit der Faelle kenne,
*       kann ich das auch in der Reihenfolge der WHEN-Anweisungen beruecksichtigen
        CASE tabix_diff.
          WHEN 12.
*            ein ADD wegzulassen, war der Tipp von Stefan.
*            Er wollte aber die Anzahl Ladenhueter am Ende berechnen,
*            ich lasse lieber diesen wahrscheinlichsten Fall weg und
*            spare so hoffentlich mehr
 
*            ADD 1 TO p_ergebnis-dauerbrenner.
          WHEN 11 OR 10.
            ADD 1 TO p_ergebnis-saison.
          WHEN OTHERS.
            ADD 1 TO p_ergebnis-ladenhueter.
        ENDCASE.
      WHEN 4.
*       Materialnummern, die gar nicht vorkommen, werden auch in der Referenzloesung gezaehlt:
*       &#40;Da verhaelt Olafs Loesung sich noch anders als die Referenz-Routine.
*       Eine kleine Aenderung korrigiert das - und spart evtl. noch ein wenig Laufzeit.&#41;
        ADD 1 TO p_ergebnis-ladenhueter.
      WHEN 8.
*       kein naechstes Material mehr, letzten Eintrag lesen
        READ TABLE tmp_input INTO tmp_wa
             INDEX sy-tfill TRANSPORTING material.
        CASE tmp_wa-material.
          WHEN p_max_matnr.
            tabix_diff = sy-tfill - last_tabix + 1.
            CASE tabix_diff.
              WHEN 12.
*                ADD 1 TO p_ergebnis-dauerbrenner.
              WHEN 11 OR 10.
                ADD 1 TO p_ergebnis-saison.
              WHEN OTHERS.
                ADD 1 TO p_ergebnis-ladenhueter.
            ENDCASE.
          WHEN OTHERS.
*           dieses Material und alle weiteren Materialien sind Ladenhueter
            p_ergebnis-ladenhueter = p_ergebnis-ladenhueter - tmp_wa-material + p_max_matnr.
        ENDCASE.
        EXIT.
    ENDCASE.
*   zuletzt gelesenen Eintrag fuer naechsten Schleifendurchlauf merken
    last_tabix = sy-tabix.
  ENDDO.
  p_ergebnis-dauerbrenner = p_max_matnr - p_ergebnis-ladenhueter - p_ergebnis-saison.
*  _rt 4.
*  format color off.
ENDFORM.                    " vergleich

GeSHi ©

Posted: **Thu May 27, 2004 3:45 pm**

Nur mal so der Vollständigkeithalber mein 'Quältext' (bin zum weiteren optimieren bisher noch nicht gekommen):

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

FORM vergleich USING    value&#40;t_input&#41;     TYPE tyt_input
                        value&#40;p_max_matnr&#41; TYPE i
               CHANGING p_ergebnis         TYPE ty_ergebnis.
* Idee - alle möglichen Werte durchgehen und sehen, wo die auftreten.
  DATA: BEGIN OF monate,
           jan&#40;1&#41; TYPE n,
           feb&#40;1&#41; TYPE n,
           mar&#40;1&#41; TYPE n,
           apr&#40;1&#41; TYPE n,
           mai&#40;1&#41; TYPE n,
           jun&#40;1&#41; TYPE n,
           jul&#40;1&#41; TYPE n,
           aug&#40;1&#41; TYPE n,
           sep&#40;1&#41; TYPE n,
           okt&#40;1&#41; TYPE n,
           nov&#40;1&#41; TYPE n,
           dez&#40;1&#41; TYPE n,
         END OF monate.
 
  DATA: wa_input         TYPE ty_input,
        testmat          TYPE ty_material,
        buchung&#40;1&#41;       TYPE n,
        buchungen_monate TYPE i,
        my_monat&#40;2&#41;      type n.
 
*  DATA: tmp_input TYPE SORTED TABLE OF ty_input
*                   WITH NON-UNIQUE KEY material budat.
 
  data: tmp_input type standard table of ty_input.
 
  SORT t_input BY material budat+4&#40;2&#41;.
  tmp_input = t_input.
  CLEAR p_ergebnis.
  DO p_max_matnr TIMES.
 
    testmat = sy-index.
    CLEAR: monate, my_monat, buchungen_monate.
 
    do 12 times.
    my_monat = sy-index.
    read table tmp_input with key material = testmat
                                  budat+4&#40;2&#41; = my_monat
                                  transporting no fields
                                  binary search.
 
    if sy-subrc eq 0.
     add 1 to buchungen_monate.
    endif.
    enddo.
 
    IF buchungen_monate = 12.
      ADD 1 TO p_ergebnis-dauerbrenner.
    ELSEIF buchungen_monate >= 10.
      ADD 1 TO p_ergebnis-saison.
    ELSE.
      ADD 1 TO p_ergebnis-ladenhueter.
    ENDIF.
 
  ENDDO.
ENDFORM.
 

GeSHi ©

Hermann

Posted: **Thu May 27, 2004 4:23 pm**

Hallo Hermann,
Du bist auf dem richtigen Weg. Ich habe Deine Routine nur minimal angepasst und die folgenden Ergebnisse erzielt (Deine geposteten Werte stimmten mit denen auf meinem System überein).

10 1,05 schneller (vorher 1,15 langsamer)
100 2,07 ( vorher 1,65 )
1.000 4,99 ( vorher 3,71 )
10.000 24,73 ( vorher 16,58 )
100.000 232,95 ( vorher 119,26 )

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

FORM vergleich USING          t_input      TYPE tyt_input
                              p_max_matnr  TYPE i
               CHANGING p_ergebnis         TYPE ty_ergebnis.
* Idee - alle möglichen Werte durchgehen und sehen, wo die auftreten.
 
  TYPES: BEGIN OF matmm,
           material TYPE ty_material,
           mm&#40;2&#41;    TYPE n,
         END   OF matmm.
 
  DATA: wa_input         TYPE ty_input,
        testmat          TYPE ty_material,
        buchungen_monate TYPE i,
        my_monat&#40;2&#41;      TYPE n.
 
  DATA: tmp_input TYPE HASHED TABLE OF matmm WITH UNIQUE KEY material mm,
        l_input   LIKE LINE OF tmp_input.
 
  LOOP AT t_input INTO wa_input.
    l_input-material = wa_input-material.
    l_input-mm       = wa_input-budat+4&#40;2&#41;.
    COLLECT l_input INTO tmp_input.
  ENDLOOP.
 
  CLEAR p_ergebnis.
  DO p_max_matnr TIMES.
    testmat = sy-index.
    CLEAR buchungen_monate.
 
    DO 12 TIMES.
      my_monat = sy-index.
      READ TABLE tmp_input WITH TABLE KEY material = testmat
                                          mm       = my_monat
                           TRANSPORTING NO FIELDS.
      IF sy-subrc EQ 0.
        ADD 1 TO buchungen_monate.
      ENDIF.
    ENDDO.
 
    IF buchungen_monate = 12.
      ADD 1 TO p_ergebnis-dauerbrenner.
    ELSEIF buchungen_monate >= 10.
      ADD 1 TO p_ergebnis-saison.
    ELSE.
      ADD 1 TO p_ergebnis-ladenhueter.
    ENDIF.
  ENDDO.
ENDFORM.                    "vergleich

GeSHi ©

VG Olaf

Posted: **Thu May 27, 2004 4:35 pm**

Hallo zusammen,
da nun zu allen bisherigen Ergebnissen auch die Codings vorliegen, will ich Euch das Coding zu meiner zweiten Variante nicht vorenthalten.

Interessant finde ich mal wieder wie viele Wege nach Rom führen.

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

form vergleich   using          t_input      type tyt_input
                                p_max_matnr  type i
                 changing p_ergebnis         type ty_ergebnis.
 
  types: begin of ty_mon,
           material  type ty_material,
           monat&#40;6&#41;,
         end of ty_mon.
 
  types: begin of ty_col,
           material type ty_material,
           count type i,
         end of ty_col.
 
  data: t_mon type hashed table of ty_mon
                    with unique key table_line,
        l_mon like line of t_mon.
 
  data: t_col type hashed table of ty_col
                    with unique key material,
        l_col like line of t_col.
 
  l_col-count = 1.
  loop at t_input into l_mon.
    insert l_mon into table t_mon.
    check sy-subrc = 0.
    l_col-material = l_mon-material.
    collect l_col into t_col.
  endloop.
 
  clear p_ergebnis.
 
  loop at t_col into l_col.
    if l_col-count = 12.
      add 1 to p_ergebnis-dauerbrenner.
    elseif l_col-count >= 10.
      add 1 to p_ergebnis-saison.
    else.
      add 1 to p_ergebnis-ladenhueter.
    endif.
  endloop.
endform.                    " vergleich

GeSHi ©

VG Olaf

Posted: **Mon May 31, 2004 11:03 am**

Olaf P. hat geschrieben:Hallo zusammen,
da nun zu allen bisherigen Ergebnissen auch die Codings vorliegen, will ich Euch das Coding zu meiner zweiten Variante nicht vorenthalten.

Das duerfte wohl die für die meisten Fälle beste Lösung sein, noch dazu kompakter Code.
Was will man mehr.
Die Idee, die erste Hashed Table mit INSERT zu füllen und dann den SY-SUBRC auszuwerten, war genial.
(Und ab Release 6.40 kann die hashed table auch wesentlich mehr als 2^22 Einträge aufnehmen.
Zwar wird das COLLECT bzw. INSERT dann wegen zunehmehder Hash-Kollisionen immer langsamer, aber nicht so sehr, dass andere Alternativen wirklich besser sind.)

Allenfalls für Extremfälle kann man mit mehr Aufwand noch alternative Lösungen finden, die besser sind als Dein Besipiel.
Diese haben aber im Gegensatz zu Deinem Beispiel den Nachteil, dass (abgesehen von der schlechteren Wartbarkeit wegen des komplexeren Algorithmus) die Performance total in den Keller geht, wenn der Input gravierend von dem abweicht, wofür die Alternativ-Lösungen optimiert wurden.

Posted: **Tue Jun 01, 2004 12:19 am**

Resumee:

Nach Auswertung der geposteten Routinen stelle ich fest, dass der beste Lösungsansatz wohl ein 2-Schritt-Verfahren zu sein scheint.

Im 1. Schritt wird die Tabelle auf eine sortierte und verdichtete Form gebracht ( pro Monat maximal 1 Einttrag ) und im 2. Schritt wird dann gezählt wieviele Einträge pro Material vorhanden sind.

Der pragmatische Ansatz wäre

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

  FIELD-SYMBOLS: <input> TYPE ty_input.
  DATA: zaehler TYPE i.
  CLEAR p_ergebnis.
* 1. Schritt - sortierte, verdichtete Tabelle
 
  SORT t_input by material budat.
  DELETE ADJACENT DUPLICATES FROM t_input COMPARING budat&#40;6&#41;.
 
* 2. Schritt - zählen, wie oft jedes Material gebucht wurde
  LOOP AT t_input ASSIGNING <input>.
 
    AT NEW material.
      CLEAR zaehler.
    ENDAT.
 
    ADD 1 TO zaehler.
 
    AT END OF material.
      IF zaehler = 12.
        ADD 1 TO p_ergebnis-dauerbrenner.
      ELSEIF zaehler >= 10.
        ADD 1 TO p_ergebnis-saison.
      ENDIF.
    ENDAT.
 
  ENDLOOP.
  p_ergebnis-ladenhueter = p_max_matnr - p_ergebnis-dauerbrenner
                                       - p_ergebnis-saison.
 

GeSHi ©

Dies ist ein übersichtlicher und für spätere Entwickler leicht zu durchschauender Code und grob das, was ich wohl bei einem Kunden so stehen lassen würde.

Die weiteren Optimierungen beruhen darauf (wie Frank ja gepostet hatte), dass ein Großteil der Rechenzeit beim Sortieren der Tabelle draufgeht .
Eine überarbeitete Version hat Frank dann ja auch schon in seinem 1. (allgemeingültigem) Posting mitgeliefert, in dem der 1. Schritt nun so aussah.

Code: [Select all] [Expand/Collapse] [Download] (Untitled.txt)

 
* 1. Schritt überarbeitet
 LOOP AT t_input INTO my_input.
    tmp_wa-material = my_input-material.
    tmp_wa-m = my_input-budat+4&#40;2&#41;.
    COLLECT tmp_wa INTO tmp_input.
  ENDLOOP.

GeSHi ©

Den finalen Schliff hat dann Olaf P. in seinem letzten Posting gegeben, in dem er die Hauptarbeit des Zählens in den 1. Schritt integriert hat mit dem Tool, das uns SAP zur Hand gibt - eine Tabelle und dem Befehl COLLECT. Die Methode den SY-SUBRC des Collect, den er für den 1. Schritt sowieso braucht, auszuwerten und in einer 2. Tabelle mitzählen zu lassen wie häufig pro Material der Collect wirklich einen neuen Eintrag erzeugt hat, führt zu einem effizienten und elegantem Code.

Abschließende Bemerkungen:
1.) Weitere Effizienzsteigerungen lassen sich dadurch erzielen, dass man Aussagen über die statistische Verteilung in der Tabelle INPUT machen kann und die Routinen dementsprechend anpasst.

2.) Wenn man nicht über "SORT, DELETE-ADJACENT-DUPLICATES" geht, sondern die verbesserte Version eine sortierte, verdichtete Tabelle zu erstellen verwendet, wird die Origaltabelle (INPUT) ja nicht verändert. Und da ein nicht unerheblicher Teil der Laufzeit für die Wertübergabe der Inputtabelle draufgeht, könnte man stattdessen eine Referenzübergabe verwenden (war aber nicht erlaubt lt. Aufgabenstellung - somit nur als Anmerkung)

3.) Ich habe die oben gepostete Demolösung mal mit der letzten Version von Olaf P. ( die schnellste gepostete) verglichen. Olafs Version ist bei 100.000 Einträgen ca. um den Faktor 2 schneller als die pragmatische Lösung.
Das sind Welten - aber verglichen mit der Ersparnis der Demolösung gegenüber der ursprünglichen Referenzlösung (Faktor > 100 ) nicht so viel.
Da kommts dann wohl auf das Projekt und die genauen Umgebungsparameter (Kunden) an, die bestimmen ob der pragmatische Ansatz schon ausreicht oder noch daran rumgefeilt werden muss. Möglich ist viel, wie man sieht...

4.) Danke an alle, die hier gepostet haben.

5.) Ich hänge noch eine überarbeitete Version des Programms an, welches die geposteten Lösungen enthält und es zulässt die einzelnen Versionen (bzw eigene) gegeneinander auszutesten. (Und statt des Mittelwert der Laufzeit alternativ die minimale Laufzeit bei mehreren Durchläufen als Faktor zur Berechnung zulassen kann. Hatte mich Frank drauf aufmerksam gemacht und beim Betrachten und Vergleichen der verschiedenen Lösungen bin ich auch zu der Ansicht gelangt, dass dies wohl der bessere Ansatz ist)

Posted: **Tue Jun 01, 2004 7:01 am**

Moin zusammen!

@Frank
Vielen Dank für das Kompliment.

@Stefan
M.E. fehlt beim "Delete Adjacent .. Comparing" noch die Materialnummer.

Es müsste auch noch ein bisschen schneller gehen, wenn man den "Clear zaehler" in die "End of Material"-Verarbeitung verschiebt und sich so die "At new"-Verarbeitung spart.

Bei meinen Tests hat sich auch gezeigt, dass der ASSIGNING langsamer als die Übertragung in eine Workarea ist. In der Praxis wird es schneller sein, da die Strukturen selten so schmal sind.

Ich finde es ist auch wichtig, dass Programme möglichst flexibel und robust sind. Konkret in Deinem Beispiel: Welche Routinen funktionieren noch, wenn die Materialnummern nicht numerisch oder fortlaufend sind?

@All
Hier ging es nur um die Performance und nichts anderes. In der Praxis würde ich eine übersichtlichere und wartbarere Routine einer schnelleren vorziehen, wenn die Differenz nur wenige Prozent beträgt. Ausnahme, das Programm läuft bspw. minütlich im Hintergrund und es kommt auf jede Sekunde an, die der Hintergrundprozess früher frei wird.

VG und eine schöne Woche
Olaf

Abap Forum on Gate²App

Laufzeitoptimierung: Tuning-Challenge - Part I